datax实现mysql增量同步_datax 3.0配合crontab实现数据定时增量同步

使用datax 实现数据增量同步踩坑记录

前提概要

由于项目上需要将a服务器数据同步至b服务器，一开始使用mysql主从复制，但是由于主从同步无法触发位于b服务器的触发器，只能放弃此方案。后来找到了datax可以实现数据同步同时也可以触发触发器，决定使用此方案。

datax准备安装datax，python，jdk datax下载及安装地址

根据自身需求选择合适的writer和reader，我这里选择的是mysqlwriter和mysqlreader

下面是我使用的json文件，有两点需要注意

我在 where 使用了sql 语句 create_time > FROM_UNIXTIME(${create_time}) and create_time < FROM_UNIXTIME(${end_time}) ，其中FROM_UNIXTIME()是mysql时间戳转换为时间格式的函数，${name}是datax提供的占位符后面会使用到

reader中连接字符串添加了 useUnicode=true&characterEncoding=utf8 ，因为没有加这个导入到目标数据库中文乱码了，虽然我两边的数据库都是utf8mb4格式的 {

"job": {

"setting": {

"speed": {

"channel": 3

"errorLimit": {

"record": 0,

"percentage": 0.02

}

"content": [

{

"reader": {

"name": "mysqlreader",

"parameter": {

"username": "root",

"password": "root",

"where": "create_time > FROM_UNIXTIME(${create_time}) and create_time < FROM_UNIXTIME(${end_time})",

"column": [

"clue_atta_id",

"url",

"create_time",

"atta_type",

"clue_id",

"name",

"attachment_id",

"attr_sequence"

"connection": [

{

"table": [

"bus_clue_atta"

"jdbcUrl": [

"jdbc:mysql://x.x.x.x:3306/dbname"

]

}

]

}

"writer": {

"name": "mysqlwriter",

"parameter": {

"writeMode": "insert",

"username": "root",

"password": "root",

"column": [

"clue_atta_id",

"url",

"create_time",

"atta_type",

"clue_id",

"name",

"attachment_id",

"attr_sequence"

"session": [

"set session sql_mode='ANSI'"

"connection": [

{

"jdbcUrl": "jdbc:mysql://x.x.x.x:3306/dbname?useUnicode=true&characterEncoding=utf8",

"table": [

"bus_clue_atta"

]

}

]

}

]

}

shell脚本准备因为我有多张表，编写一个脚本

需要添加source /etc/profile ，因为在cron的系统环境和shell的环境不一样，会导致 java commond not found错误参考地址

$(date +%s) 为获取系统当前时间戳， $(($end_time - 60)) 为算术表达式计算60前的时间戳

"-Dcreate_time=$create_time -Dend_time=$end_time"这里就是datax使用占位符的作用，可以将外部自定义参数传入

>>/home/gzjp/datax_log/bus_clue_atta_log.date +%Y%m%d 2>&1 我这里把日期都放入每天的日志文件以免单一文件过大

最后由于我的同步的表格较少我直接使用 & 进行后台操作以免发生阻塞 #!/bin/bash

source /etc/profile

# 截至时间设置为当前时间戳

end_time=$(date +%s)

# 开始时间设置为60s前时间戳

create_time=$(($end_time - 60))

/home/gzjp/datax/bin/datax.py /home/gzjp/jobs/bus_clue_atta_job.json -p "-Dcreate_time=$create_time -Dend_time=$end_time" >>/home/gzjp/datax_log/bus_clue_atta_log.`date +%Y%m%d` 2>&1 &

/home/gzjp/datax/bin/datax.py /home/gzjp/jobs/bus_clue_job.json -p "-Dcreate_time=$create_time -Dend_time=$end_time" >>/home/gzjp/datax_log/bus_clue_log.`date +%Y%m%d` 2>&1 &

/home/gzjp/datax/bin/datax.py /home/gzjp/jobs/bus_attachment.json -p "-Dcreate_time=$create_time -Dend_time=$end_time" >>/home/gzjp/datax_log/bus_attachment_log.`date +%Y%m%d` 2>&1 &

crontab 定时任务准备 $ crontab -e

*/1 * * * * /home/gzjp/jm_db_sync.sh >/dev/null 2>&1 我是定时每分钟跑一次脚本，注意一定要处理输入文件，因为cron会见执行情况通过mail发给用户，时间长系统会被塞爆

有意义的参考内容

datax实现mysql增量同步_datax 3.0配合crontab实现数据定时增量同步相关推荐

通过Logstash实现mysql数据定时增量同步到ES
文章目录前言一.系统配置二.同步步骤整体概览三.logstash数据同步实战 1.新建mysql表 2.ES中新建索引 3.Logstash 管道配置 4.启动Logstash 5.测试 6. ...
flink实时同步mysql_基于Canal与Flink实现数据实时增量同步(一)
点击上方蓝色字体,关注我 canal是阿里巴巴旗下的一款开源项目,纯Java开发.基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了MySQL(也支持mariaDB). 准备配置 ...
同步服务老是报错_悬而未决：MYSQL配置好主从同步后没有报错，但数据一直没有同步过来是什么原因？ | 学步园...
我是用下面的步骤来配置主从数据库服务器(都是MYSQL 5.1.47)的: 1.在主服务器上FLUSH TABLES WITH READ LOCK;然后再复制数据库文件到从服务器. 2.在主服务器上创 ...
u盘同步服务器文件,GoodSync配合U盘助你自动同步文件
首页 > 新闻动态 GoodSync配合U盘助你自动同步文件目前许多用户需要把文件带回家处理,保持单位和家里的文件同步非常重要.这里介绍一个自动同步文件的"机器人":Goo ...
mysql 两个时间相差大于24小时的数据_MySQL 主从同步延迟的原因及解决办法（仅学习）...
原文链接:https://blog.csdn.net/hao_yunfeng/article/details/82392261 Mysql主从基本原理,主要形式以及主从同步延迟原理 (读写分离)导致主 ...
linux ntp时间立即同步命令_如何在 Linux 下确认 NTP 是否同步？
我假设我你经使用上述链接设置了 NTP 服务器和 NTP 客户端.现在,如何验证 NTP 设置是否正常工作? -- Magesh Maruthamuthu(作者) NTP 意即网络时间协议(Netw ...
datax 持续数据同步_DataX数据同步
因为选择了ElasticSearch做全文检索,需要把数据从数据库同步到es,此处选择开源方案DataX作为数据同步工具. 官方文档很详细,可以直接参考. DataXDataX 是一个异构数据源离线同 ...
datax实现mysql数据同步
前言 DataX 是阿里内部广泛使用的离线数据同步工具/平台,可以实现包括 MySQL.Oracle.HDFS.Hive.OceanBase.HBase.OTS.ODPS 等各种异构数据源之间高效的数 ...
mysql增量同步kafka_MySQL数据实时增量同步到Kafka - Flume
写在前面的话需求,将MySQL里的数据实时增量同步到Kafka.接到活儿的时候,第一个想法就是通过读取MySQL的binlog日志,将数据写到Kafka.不过对比了一些工具,例如:Canel,Dat ...

datax实现mysql增量同步_datax 3.0配合crontab实现数据定时增量同步

datax实现mysql增量同步_datax 3.0配合crontab实现数据定时增量同步相关推荐

最新文章

热门文章