文章目录

  • 简介
  • 特性
  • 支持数据库
  • 其他

简介

Chunjun是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,比如MySQL,HDFS等,也可以采集实时变化的数据,比如MySQL binlog,Kafka等。同时,Chunjun也是支持原生FlinkSql所有语法和特性的计算框架,并且提供了大量案例。

特性

  • 大部分插件支持并发读写数据,可以大幅度提高读写速度;
  • 部分插件支持失败恢复的功能,可以从失败的位置恢复任务,节约运行时间;失败恢复
  • 关系数据库的Source插件支持间隔轮询功能,可以持续不断的采集变化的数据;间隔轮询
  • 部分数据库支持开启Kerberos安全认证;Kerberos
  • 可以限制source的读取速度,降低对业务数据库的影响;
  • 可以记录sink插件写数据时产生的脏数据;
  • 可以限制脏数据的最大数量;
  • 支持多种运行模式;
  • 同步任务支持执行flinksql语法的transformer操作;
  • sql任务支持和flinkSql自带connectors共用;

支持数据库

数据同步:(开源)基于Flink的数据同步工具Chunjun相关推荐

  1. 大数据是如何基于 Flink 进行实时计算的?

    Flink 因天然流式计算特性及强大处理性能,成为炙手可热的大数据处理框架,在 BAT.头条.顺丰等国内头部公司都有其相关应用. 眼下,Flink 可以说是 DT 时代程序员的加分项,更是大数据开发求 ...

  2. R语言data.table导入数据实战:data.table生成新的数据列(基于已有数据列)、生成多个数据列

    R语言data.table导入数据实战:data.table生成新的数据列(基于已有数据列).生成多个数据列 目录 R语言data.table导入数据实战:data.

  3. R语言对dataframe行数据进行筛选(row selection)、筛选数据行、基于条件筛选数据行

    R语言对dataframe行数据进行筛选(row selection).筛选数据行.基于条件筛选数据行 目录

  4. 基于数据库数据增量同步_基于 Flink SQL CDC 的实时数据同步方案

    简介:Flink 1.11 引入了 Flink SQL CDC,CDC 能给我们数据和业务间能带来什么变化?本文由 Apache Flink PMC,阿里巴巴技术专家伍翀 (云邪)分享,内容将从传统的 ...

  5. 千万数据去重_基于 Flink 的百亿数据去重实践

    在工作中经常会遇到去重的场景,例如基于 App 的用户行为日志分析系统,用户的行为日志从手机客户端上报到 Nginx 服务端,通过 Logstash.Flume 或其他工具将日志从 Nginx 写入到 ...

  6. 大数据存储项目-基于Flink的高速公路ETC入深圳数据实时分析平台

    大数据项目总体流程分为以下4个方面: 数据采集,数据存储与管理,数据处理与分析,数据解释与可视化. 文章目录 数据源 项目要求 项目流程 1.数据爬取与清洗 2.jmeter模拟高并发数据流 3.ka ...

  7. python 3d大数据可视化_基于Python的数据可视化库pyecharts介绍

    什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生 ...

  8. 《大数据》编辑推荐 | 基于遥感大数据的信息提取技术综述

    主题词 遥感大数据:目标识别:地物分割:变化检测 遥感大数据虽然能够多粒度.多时相.多方位和多层次地反映地物信息,但其数据量与日俱增.种类日益增多,且存在大量的冗余信息,使得从遥感数据中提取有效信息具 ...

  9. 『数据可视化』基于Python的数据可视化工具

    刘宇宙,现在一家创业型公司做技术总负责,做爬虫和数据处理相关工作,曾从事过卡系统研发.金融云计算服务系统研发,物联网方向大数据研发,著书一本,<Python3.5从零开始学> 如何做Pyt ...

  10. 微软开源基于云的生理学研究工具

    Bio Model Analyzer是一款微软基于云的生理学研究工具,可以用于对化细胞交互和通信进行建模,现已经在GitHub上开源,在MIT许可之下. 研究人员使用Bio Model Analyze ...

最新文章

  1. [C#] enum 枚举
  2. 小白如何在Windows如何安装双系统Centos7
  3. sklearn基本回归方法
  4. 怎么进入python官网-Python的安装及简单的使用
  5. strerror和perror函数详解
  6. 带孩子们做环球旅行的读后感_父母带孩子做心理咨询,需要注意哪些事项?
  7. 关于PyTorch中的register_forward_hook()函数未能执行其中hook函数的问题
  8. html中的rel,rev是什么?
  9. 关于RDP协议的分析 附上RDP 协议初步分析.pdf文件
  10. 前些年上班的时候基本天天加班
  11. Windows域策略设置 IE信任站点【全域策略生效】
  12. 在线html编辑器 asp,(ewebeditor)比较简单好用的ASP网页在线编辑器
  13. C# 3.0通过Linq、Lambda、匿名函数、代理函数实现数据查询
  14. python 科学计算思维导图
  15. NERO8.0刻录系统光盘
  16. 河南大学计算机组成原理,河南大学计算机组成原理考点.pdf
  17. 远程工具TeamViewer
  18. ant design pro 水印(删除、修改)
  19. JAVA爬虫挖取CSDN博客文章(续)
  20. 线段树+平衡树(STL) 勤快的love 枫

热门文章

  1. p750服务器配置信息,P750的一些配置
  2. Java中list转map的常用方法
  3. 小马哥讲Spring核心编程思想 第十周 Spring资源管理
  4. 功能测试用例设计方法,一文带你了解用例设计,再也不担心用例了
  5. 【时间序列异常检测】Anomaly Detection for IoT Time-Series Data: A Survey
  6. hibernate的hsql
  7. 记账时对收支、借还款进行分类记录
  8. Bitvise ssh client工具
  9. FluxWeakening_MTPA_FOC
  10. 科技感十足炫酷引导页网站源码