数据同步:当数据源发生改变时,其他相关数据也跟着发展变化。根据需求不同可采取以下方案。
1.触发器

在数据库建立增删改的触发器。触发器将变更放到一张临时表里。oracle同步cdc

优点:实时同步
缺点:影响到业务系统,因为需要在业务系统建立触发器

2.日志

通过分析源数据库日志,来获得源数据库中的变化的数据。oracle异步cdc

优点:不影响业务系统
缺点:有一定得延时,对于没有提供日志分析接口的数据源,开发的难度比较大

3.时间戳

在要同步的源表里有时间戳字段,每当数据发生变化,时间戳会记录发生变化的时间

优点:基本不影响业务系统
缺点:要求源表必须有时间戳这一列

4.数据比较

通过比较两边数据源数据,来完成数据同步。一般用于实时性要求不高的场景。

优点:基本不影响业务系统
缺点:效率低

5. 全表拷贝

定时清空目的数据源,将源数据源的数据全盘拷贝到目的数据源。一般用于数据量不大,实时性要求不高的场景。

优点:基本不影响业务系统,开发、部署都很简单
缺点:效率低

6.使用Kafka+kettle
通过kafka connect连接,将所有数据推给DB或Hadoop,需要ETL处理就在kafka向target source发送数据中间这里加上Kettle

优点:基本不影响业务系统,实时同步
缺点:对源有一定性能要求,对源这边有一定开发配置要求

总结:

  1. 对于没有触发器和日志的一些小型数据源,如txt 文本,excel 文件,Aceess,则只能使用后三种方式。
  2. 对于大型数据源,一般优先选择日志方式,如 kafka同步, 对于不能通过日志来实现的情况,可以考虑第1,3,4,6种方式。

大数据Kettle实时同步数据的六种方案相关推荐

  1. rsync+sersync实现数据文件实时同步

    rsync+sersync实现数据文件实时同步 使用rsync+sersync,实现nfs与backup服务器间实时数据同步 一.数据同步工具介绍 rsync是一款开源的.快速的.多功能的.可实现全量 ...

  2. Oracle 数据怎么实时同步到 MySQL | 亲测干货分享建议收藏

      摘要: 这段时间负责一个老项目开发的数据库管理工作,这个项目中开发库与测试数据库分离,其中有些系统表数据与基础资料数据经常需要进行同步,相信很多 DBA 同学经常会遇到要从一个数据库实时同步到另一 ...

  3. Oracle 数据怎么实时同步到 Kafka | 亲测干货分享建议收藏

     摘要: 很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.我自己亲测了一种方式,可以非常方便地完成 Oracl ...

  4. Oracle 数据怎么实时同步到 SQL Server | 亲测干货分享建议收藏

    摘要: 很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.我自己亲测了一种方式,可以非常方便地完成 Oracle ...

  5. Oracle 数据怎么实时同步到 PgSQL | 亲测干货分享建议收藏

    摘要: 这段时间负责一个老项目开发的数据库管理工作,这个项目中开发库与测试数据库分离,其中有些系统表数据与基础资料数据经常需要进行同步,相信很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数 ...

  6. Oracle 数据怎么实时同步到 MongoDB | 亲测干货分享建议收藏

    摘要: 很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.我自己亲测了一种方式,可以非常方便地完成 Oracle ...

  7. Oracle 数据怎么实时同步到 Elasticsearch | 亲测干货建议收藏

    摘要: 很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.我自己亲测了一种方式,很快实现了Oracle 数据实时 ...

  8. 跨系统实时同步数据解决方案

    数据量太大,单存储节点存不下,就只能把数据分片存储. 数据分片后,对数据的查询就没那么自由.如订单表按用户ID作为Sharding Key,就只能按用户维度查询.我是商家,我想查我店铺的订单,做不到. ...

  9. Oracle 数据怎么实时同步到 DM DB 达梦数据库 | 亲测干货建议收藏

    摘要 很多 DBA 同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.我自己亲测了一种方式,可以很方便地完成 Oracle 数 ...

最新文章

  1. 文件管理器_苹果超强文件管理器,秒变安卓?
  2. windows下的php的memcache扩展的安装及memcache最新下载地址
  3. openresty开发系列39--nginx+lua实现接口签名安全认证
  4. Visual Studio 2010 Ultimate敏捷测试驱动开发
  5. C++中使用new和delete运算符实现二维数组的操作
  6. FIO工具测试延迟、带宽、IOPS
  7. WInform中实现设置ZedGraph中曲线的X轴与Y轴的上限与下限
  8. 趁爸妈不在家约男朋友回家吃饭,然而......
  9. 重磅!DataFountain新上两项CV算法竞赛-32万巨奖等你来拿!
  10. 算法笔记_100:蓝桥杯练习 算法提高 三个整数的排序(Java)
  11. 罗永浩要造智能音箱;苹果承认bug;微软特制AI曝光 | 极客头条
  12. 联想微型计算机怎么恢复系统,联想电脑台式一体机怎么重装系统 台式一体机重装系统...
  13. sql: sql developer tunnel转接
  14. 拓端tecdat|R语言markov switching model马尔可夫转换模型研究商业周期
  15. C陷阱与缺陷-1理解函数申明
  16. android窗口变化事件,android ViewPager滑动事件讲解
  17. mysql5.7导出数据提示–secure-file-priv选项问题的解决方法
  18. rimraf 命令快速删除 node_modules 包
  19. 个人网站到底怎样赚钱 [zt]
  20. Baxter实战——Ubuntu 14.4+ros indigo 安装Baxter Simulator与 Moveit

热门文章

  1. 【Three.js基础】坐标轴辅助器、requestAnimationFrame处理动画、Clock时钟、resize页面尺寸(二)
  2. python load是什么意思_Python中 1, == 1, 的意思是什么?
  3. 90个PHP常用接口数据过滤的方法
  4. 鞍山python培训班
  5. vscode 打开工程磁盘利用率100%系统卡顿无法工作
  6. ​阿里巴巴总市值超过4000亿美元,“股神”巴菲特:没买阿里巴巴股票是个错误!...
  7. 学习CSS3 3D转换,制作一个3D立方体
  8. VUE中让字体大小跟随窗口变化
  9. 你的计算机无法识别扫描仪,计算机无法检测到照相机或扫描仪,怎么处理呢?
  10. 同步FIFO设计verilog设计及仿真