Giter VIP home page Giter VIP logo

filling's Introduction

Maven Package

Filling

Filling, 如其名, 致力于填充你的各种存储, 是一个非常易用高性能、支持实时流式离线批处理海量数据处理产品,架构于 Apache Flink之上。


filling设计思路参考waterdrop: [https://interestinglab.github.io/waterdrop/]


为什么我们需要 Filling

我们在使用 Flink 时发现了很多不便捷之处, 通过我们的努力让Filling的使用更简单,更高效,并将业界和我们使用Flink的优质经验固化到Filling中,明显减少学习成本,加快分布式数据处理能力在生产环境落地。 除了大大简化分布式数据处理难度外,Filling尽所能为您解决可能遇到的问题:

  • 数据丢失与重复
  • 任务堆积与延迟
  • 吞吐量低
  • 应用到生产环境周期长
  • 缺少应用运行状态监控

Filling 使用场景

  • 海量数据ETL
  • 海量数据聚合
  • 多源数据处理

Filling 的特性

  • 简单易用,灵活配置,无需开发
  • 实时流式处理
  • 离线多源数据分析
  • 高性能
  • 海量数据处理能力
  • 模块化和插件化,易于扩展
  • 支持利用SQL做数据处理和聚合
  • 支持flink
  • 目前支持flink1.31.1

Filling 的工作流程

image-20211011150714876

graph TD
source[source] --> transfrom[transfrom]
transfrom --> sink[sink]

快速体验

Filling 功能截图

任务列表

image-20211011150935022

编辑任务

image-20211011151632652

查看任务

image-20211011151528347

多个Filter构建了数据处理的Pipeline,满足各种各样的数据处理需求,如果您熟悉SQL,也可以直接通过SQL构建数据处理的Pipeline,简单高效。目前Filling支持的Filter列表, 仍然在不断扩充中。您也可以开发自己的数据处理插件,整个系统是易于扩展的。

Filling 支持的插件

  • Input plugin

kafka, file, jdbc , 自行开发的Input plugin

  • Filter plugin

DataAggregates,DecodeBase64,FieldOperation,FieldRename,FieldTypeConver, DataJoin, EncodeBase64,FieldOrder.,FieldSelect,Sql, DataSelector, FieldJavaScript, FieldRemove, FieldSplit, 自行开发的Filter plugin

  • Output plugin

Elasticsearch, File, Jdbc, Kafka, Mysql, Stdout, 自行开发的Output plugin

环境依赖

  1. java运行环境,java >= 11

  2. 如果您要在集群环境中运行Filling,那么需要以下flink集群环境的任意一种:

  • Flink on Yarn // TODO
  • Flink Standalone
  • Flink on Mesos // TODO

如果您的数据量较小或者只是做功能验证,也可以仅使用local模式启动,无需集群环境,Filling支持单机运行。

文档

[https://zihjiang.github.io/filling-book/]

贡献观点和代码

提交问题和建议:https://github.com/zihjiang/Filling/issues

贡献代码:https://github.com/zihjiang/Filling/pulls

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.