Redis2.8 psync1解决什么问题

在psync1功能出现前(redis2.8之前的版本),redis复制秒级中断,就会触发从实例进行fullsync。
每一次的fullsync,集群的性能和资源使用都可能带来抖动;如果redis所处的网络环境不稳定,那么fullsync的出步频率可能较高。
为解决此问题,redis2.8引入psync1, 有效地解决这种复制闪断,带来的影响。

redis的fullsync对业务而言,算是比较“重”的影响;对性能和可用性都有一定危险。
 fullsync常见的影响:

1. master需运行bgsave,出现Fork,可能造成master达到毫秒或秒级的卡顿(latest_fork_usec);
    2. redis进程Fork导致Copy-On-Write内存使用消耗(后文简称COW),最大能导致master进程内存使用量的消耗。    
    (eg RDB: 5213 MB of memory used by copy-on-write)
    3. Redis Slave load RDB过程,会导致复制线程的client output buffer增长很大;增大Master进程内存消耗;
    4. Redis保存RDB(不考虑disless replication),导致服务器磁盘IO和CPU(压缩)资源消耗
    5. 发送数GB大小的RDB文件,会导致服务器网络出口爆增,如果千兆网卡服务器,期间会影响业务正常请求响应时间(以及其他连锁影响)
psync1解决的问题:

redis2.8为支持psync1,引入了replication backlog buffer(后文称:复制积压缓冲区);

复制积压缓冲区是redis维护的固定长度缓冲队列(由参数repl-backlog-size设置,默认1MB),
master的写入命令在同步给slaves的同时,会在缓冲区中写入一份(master只有1个积压缓冲区,所有slaves共享)。

当redis复制中断后,slave会尝试采用psync, 上报原master runid + 当前已同步master的offset(复制偏移量,类似mysql的binlog file和position);
如果runid与master的一致,且复制偏移量在master的复制积压缓冲区中还有(即offset >= min(backlog值),master就认为部分重同步成功,不再进行全量同步。

redis2.8的部分同步机制,有效解决了网络环境不稳定、redis执行高时间复杂度的命令引起的复制中断,从而导致全量同步。但在应对slave重启和Master故障切换的场景时,psync1还是需进行全量同步。

psync1缺点:

从上文可知,psync1需2个条件同时满足,才能成功psync: master runid不变 和复制偏移量在master复制积缓冲区中。
那么在redis slave重启,因master runid和复制偏移量都会丢失,需进行全量重同步;
redis master发生故障切换,因master runid发生了变化;故障切换后,新的slave需进行全量重同步。

而slave维护性重启、master故障切换都是redis运维常见场景,为redis的psync1是不能解决这两类场景的成功部分重同步问题。

因此redis4.0的加强版部分重同步功能-psync2,主要解决这两类场景的部分重新同步。

psync2:

在redis cluster的实际生产运营中,实例的维护性重启、主实例的故障切换(如cluster failover)操作都是比较常见的(如实例升级、rename command和释放实例内存碎片等)。而在redis4.0版本前,这类维护性的处理,redis都会发生全量重新同步,导到性能敏感的服务有少量受损。
如前文所述,psync2主要让redis在从实例重启和主实例故障切换场景下,也能使用部分重新同步。
本节主要简述psync2在这两种场景的逻辑实现。
名词解释:

master_replid : 复制ID1(后文简称:replid1),一个长度为41个字节(40个随机串+'\0')的字符串。redis实例都有,和runid没有直接关联,但和runid生成规则相同,都是由getRandomHexChars函数生成。当实例变为从实例后,自己的replid1会被主实例的replid1覆盖。
master_replid2:复制ID2(后文简称:replid2),默认初始化为全0,用于存储上次主实例的replid1
实例的replid信息,可通过info replication进行查看; 示例如下:

127.0.0.1:6385> info replication
# Replication
role:slave
master_host:xxxx      // IP模糊处理
master_port:6382
master_link_status:up
slave_repl_offset:119750
master_replid:fe093add4ab71544ce6508d2e0bf1dd0b7d1c5b2  //这里是主实例的replid1相同
master_replid2:0000000000000000000000000000000000000000  //未发生切换,即主实例未发生过变化,所以是初始值全"0"
master_repl_offset:119750
second_repl_offset:-1
Redis从实例重启的部分重新同步

在之前的版本,redis重启后,复制信息是完全丢失;所以从实例重启后,只能进行全量重新同步。
redis4.0为实现重启后,仍可进行部分重新同步,主要做以下3点:
1 redis关闭时,把复制信息作为辅助字段(AUX Fields)存储在RDB文件中;以实现同步信息持久化。
2 redis启动加载RDB文件时,会把复制信息赋给相关字段;为部分同步
3 redis重新同步时,会上报repl-id和repl-offset同步信息,如果和主实例匹配,且offset还在主实例的复制积压缓冲区内,则只进行部分重新同步。

redis关闭时,持久化复制信息到RDB

redis在关闭时,通过shutdown save,都会调用rdbSaveInfoAuxFields函数,
把当前实例的repl-id和repl-offset保存到RDB文件中。
说明:当前的RDB存储的数据内容和复制信息是一致性的。熟悉MySQL的同学,可以认为MySQL中全量备份数和binlog信息是一致的。

redis从实例尝试部分重新同步

redis实例重启后,从RDB文件中加载(注:此处不讨论AOF和RDB加载优先权)master_replid和master_repl_offset;相当于实例的server.cached_master。当我们把它作为某个实例的从库时(包含如被动的cluster slave或主动执行slaveof指令),实例向主实例上报master_replid和master_repl_offset+1;从实例同时满足以下两条件,就可以部分重新同步:
1 从实例上报master_replid串,与主实例的master_replid1或replid2有一个相等
2 从实例上报的master_repl_offset+1字节,还存在于主实例的复制积压缓冲区中

从实例尝试部分重新同步函数slaveTryPartialResynchronization(replication.c文件中);
主实例判断能否进行部分重新同步函数masterTryPartialResynchronization(replication.c文件中)。

redis重启时,临时调整主实例的复制积压缓冲区大小

redis的复制积压缓冲区是通过参数repl-backlog-size设置,默认1MB;为确保从实例重启后,还能部分重新同步,需设置合理的repl-backlog-size值。
1 计算合理的repl-backlog-size值大小
通过主库每秒增量的master复制偏移量master_repl_offset(info replication指令获取)大小,
如每秒offset增加是5MB,那么主实例复制积压缓冲区要保留最近60秒写入内容,backlog_size设置就得大于300MB(60*5)。而从实例重启加载RDB文件是较耗时的过程,如重启某个重实例需120秒(RDB大小和CPU配置相关),那么主实例backlog_size就得设置至少600MB.

计算公式:backlog_size = 重启从实例时长 * 主实例offset每秒写入量

2 重启从实例前,调整主实例的动态调整repl-backlog-size的值。
通过config set动态调整redis的repl-backlog-size时,redis会释放当前的积压缓冲区,重新分配一个指定大小的缓冲区。 所以我们必须在从实例重启前,调整主实例的repl-backlog-size。

psync2实现Redis Cluster Failover部分全新同步

为解决主实例故障切换后,重新同步新主实例数据时使用psync,而分fullsync;

1 redis4.0使用两组replid、offset替换原来的master runid和offset.
2 redis slave默认开启复制积压缓冲区功能;以便slave故障切换变化master后,其他落后从可以从缓冲区中获取写入指令。
第一组:master_replid和master_repl_offset
如果redis是主实例,则表示为自己的replid和复制偏移量; 如果redis是从实例,则表示为自己主实例的replid1和同步主实例的复制偏移量。

第二组:master_replid2和second_repl_offset
无论主从,都表示自己上次主实例repid1和复制偏移量;用于兄弟实例或级联复制,主库故障切换psync.
初始化时, 前者是40个字符长度为0,后者是-1; 只有当主实例发生故障切换时,redis把自己replid1和master_repl_offset+1分别赋值给master_replid2和second_repl_offset。
这个交换逻辑实现在函数shiftReplicationId中。

这样发生主库故障切换,以下三种常见结构,都能进行psync:
1 一主一从发生切换,A->B 切换变成 B->A ;
2 一主多从发生切换,兄弟节点变成父子节点时;
3 级别复制发生切换, A->B->C 切换变成 B->C->A

————————————————
版权声明:本文为CSDN博主「天码行空的码」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_42409788/article/details/104246731

rsync psynx相关推荐

  1. centos 多台 文件夹同步_CentOS7配置rsync实现文件同步

    rsync(remote synchronize )是一个远程文件同步工具,支持多个操作系统,用于在多台服务器之间同步目录和文件.rsync采用增量传输文件的方法,只传输新文件和修改过的文件,而不是每 ...

  2. 常用rsync命令操作梳理

    作为一个运维工程师,经常可能会面对几十台.几百台甚至上千台服务器,除了批量操作外,环境同步.数据同步也是必不可少的技能. 说到"同步",不得不提的利器就是rsync.rsync不但 ...

  3. RSync实现文件备份同步

    rsync是类unix系统下的数据镜像备份工具,从软件的命名上就可以看出来了--remote sync.它的特性如下: 1.可以镜像保存整个目录树和文件系统. 2.可以很容易做到保持原来文件的权限.时 ...

  4. linux cp sync,通过SSH使用Rsync传输文件,复制和同步文件及目录

    在本文中,我们将解释如何通过SSH使用rsync复制文件.当涉及在网络上的系统之间传输文件时,Linux和Unix用户可以使用许多工具,最流行的数据传输协议是SSH和FTP,虽然FTP很受欢迎,但总是 ...

  5. Linux rsync目录同步功能实现

    实现目标: A 服务器上 /opt/web 目录,与B服务器上 /opt/web目录实现同步.即:B主动与A进行同步. OS: Reaht AS4 A Server  192.168.1.2 /opt ...

  6. 在Mac和Linux之间用Rsync 拷贝文件

    因为公司的苹果服务器是物理机,所以备份一直是个问题.Backup Exec 2012 勉强能工作,但是速度和可靠性一直都被我们所诟病.最后,老板决定把所有的数据copy到linux的共享文件夹,然后用 ...

  7. centos6.5 rsync+inotify同步配置笔记

    以两台服务器为例: 主服务器: 192.168.1.100 从服务器: 192.168.1.101 1.安装rsync (主服务器与从服务器同时安装) 使用xinetd管理rsync yum inst ...

  8. Centos7 下 配置 rsync 以及 rsync+inotify 实时同步

    Centos 7 下 配置 Rsync 以及 rsync+inotify 实时同步 rsync介绍 rsync是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支 持增量备份,保持链接和 ...

  9. windows 上rsync客户端使用方法

    阅读目录 1.1 获取 windows上实现rsync的软件(cwRsync) 1.2 cwrsync的使用方法 1.3 cwrsync的使用 回到顶部 1.1 获取 windows上实现rsync的 ...

最新文章

  1. 人群密度估计--CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
  2. linux设置密码过期时间
  3. SQL-根据多个条件更新数据
  4. Robot Framework 自动化框架 - 定制自己的library
  5. 算法学习笔记2022.1.11
  6. 关于Visual C#.NET数据库开发经典案例解析(附光盘两张)(珍藏版)—的读后感...
  7. 计算机消失了一个磁盘,win7系统重装后莫名奇妙消失一个分区磁盘的解决方法...
  8. 鲸准2020年度产业投资白皮书
  9. MySQL之 视图,触发器,事物,存储过程,函数(Day48)
  10. python nltk 8 分析句子结构
  11. 邮箱搬家操作步骤及详细说明
  12. Android O 修改吉字节为GB
  13. 在Total Commander下使用sftp操作服务器
  14. 不同操作系统图片显示发生颠倒,linux ubuntu win7 win10
  15. mysql 1058 无法启动服务_案例:MySQL服务无法启动 系统发生1058错误
  16. 意识比智力重要,选择比努力重要
  17. 微信指数批量采集、导出
  18. linux——awk(3):awk变量
  19. 谁是中国移动互联网的王者?360发布定制手机消息随感
  20. android 定时响铃,Android 中利用广播接收器(BroadCastReceiver)来接收定时响铃的闹铃信息...

热门文章

  1. Swift之函数的语法分析和使用示例
  2. mark一下,今天可乐左眼分泌黄色的粘稠物
  3. MATLAB(一)基本操作与矩阵输入
  4. 思维导图工具有哪些?快来看看这些工具
  5. 简书python_在简书上一起学Python是怎样一种体验
  6. 计算机指令长度是固定的,第四次作业 指令系统 设计算机A有60条指令,指令操作码6位固定长...
  7. 插入U盘老是弹出U盘扫描和提示修复提示怎么解 决
  8. 福建两会声音| 自强自立,加快建设创新型省份
  9. Python基础学习——面向对象编程(第一讲:面向对象概述、面向对象三个基本特征(封装性、继承性、多态性)、类和对象(定义类、创建和使用对象、实例变量、类变量、构造方法、实例方法、类方法、静态方法))
  10. matlab、carsim、prescan联合仿真从零开始详细步骤