为什么80%的码农都做不了架构师?>>>   

main_loop

kill -o daemon is still running
ping local daemon
if election_timeout out
get debug_level
get relevant tunables
get runstate
get recovery lock file from the server
get nodemap
flags
if self_ban
if stop banned frozen
Retrieve capabilities from all connected nodes
validate_recovery_master --> force_election
verify ip public ip {

ips.pnn == self && dont have ip
ips.pnn != self && have ip
} tell recmaster takeover_run


down here only run with recmaster
flags right
active nodes agree we are recmaster --> force_election get vnnmap
need recovery --> do_recovery
verify all active nodes not in recover mode --> do_recovery
hold recovery lock --> do_recovery
get remote_nodemaps --> do_recovery
num_lmasters
vnnmap->size != num_lmasters --> do_recovery
nodemap node also in vnnmap --> do_recovery
all nodes have same vnnmap
if need_takeover_run do_takeover_run


<span id="force_election"></span>

force_election

election_handler

rec = self ctdb = rec->ctdb
pnn == self out

ctdb_election_win

states
longest running
biggest pnn

release recover lock file
let recmaster = that


<h1 id="do_recovery"></h1> # do_recovery > we are rec > need_recovery = true > begin > self_ban > recover_lock_file F_SETLK 为 F_WRLCK > get list of all databases dbmap > create missing local db > create missing remote db > update use same lock files > [db_recovery_parallel](#db_recovery_parallel) > [do_takeover_run](#do_takeover_run) > send message reconfigured > need_recovery = false > end > wait rerecovery_timeout


<span id='db_recovery_parallel'></span>

db_recovery_parallel

envvar CTDB_RECOVERY_HELPER
dir CTDB_HELPER_BINDIR == /usr/libexec/ctdb/
file ctdb_recovery_helper
pipe libsocket
args[0] = fd[1]
args[1] = daemon.name = CTDB_SOCKET = /var/run/ctdb/ctdb.socket
args[2] = random !=1
exec /usr/libexec/ctdb/ctdb_recovery_helper
<log-fd> <output-fd> <ctdb-socket-path> <generation>
1 1 /var/run/ctdb/ctdbd.socket 2


<span id='do_takeover_run'></span>

do_takeover_run

is_in_progress done
begin
srvid = 0 pnn = -1
list_of_connected_nodes
disable takeover_runs 60s
ctdb_takeover_run
reenable takeover_runs
ok
end

<span id='ctdb_takeover_run'></span>

ctdb_takeover_run

  • 分配 ipalloc_state的内存,包括每个节点数组
  • 填充 ipalloc_state的ip分配算法
  • 本地填充 ipalloc_state NoIPFailback 参数--这是一个真正的集群范围的配置,只有master使用此值
  • 取所有连接的节点的 NoIPTakeover 和 NoIPHostOnAllDisabled --这各动作是分开执行的,所以在单元测试过程中可以伪造
  • 填充 ipalloc_state 的 NoIPTakover
  • 填充 ipalloc_state 的 NoIPHost ,衍生出节点 flags 和 NoIPHostOnAllDisabled
  • 检索和填充 ipalloc_state 已知和可用的IP列表
  • 如果没有可用IP地址,则提前退出
  • 构建列表(已知的IPs,当前指定的节点)
  • 填充节点列表以强制重新平衡 - 内部结构,目前没有办法获取,只有使用LCP2算法 增加了新的IP地址的节点
  • 运行IP分配算法
  • 发送 RELEASE_IP 到所有节点的 取消不应有的ips
  • 发送 TAKE_IP 到所有节点的 配置应有ips
  • 发送 IPREALLOCATED 所有节点(向后兼容的 hack )

ipalloc_state_init

三种算法 ipalloc_lcp2 ==> 默认
ipalloc_deterministic ==> pnn = i % numnodes ipalloc_nondeterministic ==> min以pnn=0为基准,轮询 已有ip<min的则可收ip

<span id='ipalloc_lcp2'></span>

ipalloc_lcp2

unassign_unsuitable_ips 不匹配的ip的pnn = -1
lcp2_init
lcp2_allocate_unassigned

^运算 计算出从高到低不同=distance ipv4 32 + 32 + dis + 32 = 0 ~ 128 sum = ip 到其他每个ip distance平方和 minnode || mindstdsum rebalance_candidates
lcp2_failback
均衡所有lcp2_imbalances

转载于:https://my.oschina.net/banwh/blog/1526714

ctdb main loop相关推荐

  1. “RuntimeError: main thread is not in main loop“的几种解决方案

    方法一(Tkinter) 最后写 root.mainloop() 当然,如果不是root,则应使用Tk对象的名称代替root. 方法二(多线程) 将线程设置为守护程序 t = threading.Th ...

  2. 七、GLib主要的事件循环(The Main Event Loop)

    1 GMainLoop.GMainContext.GSource 1.1 三者之间关系 GMainLoop -> GMainContext -> {GSource1, GSource2,G ...

  3. python3 异步错误 asyncio.Semaphore RuntimeError: Task got Future attached to a different loop

    错误现象 asyncio.Semaphore RuntimeError: Task got Future attached to a different loop asyncio.Semaphore ...

  4. python loop call soon_python中call方法怎么使用?

    基本上关于call没有单独使用的,一般是结合着三种函数进行应用,大家应该看过call_soon吧,如果大家看过的话,就应该知道我们这个函数可能和调用有关系吧,如果看到这里,您的想法一致,那么恭喜您,您 ...

  5. 基于Golang的CLI 命令行程序开发

    基于Golang的CLI 命令行程序开发 [阅读时间:约15分钟] 一. CLI 命令行程序概述 二. 系统环境&项目介绍&开发准备 1.系统环境 2.项目介绍 3.开发准备 三.具体 ...

  6. 单片AT89C2051 + SD卡 + 3310LCD = 音乐播放器

    http://www.amobbs.com/thread-4503884-1-1.html 这个小玩意,采用 ATMEL 的传统51MCU作主控制芯片,加上SD卡和显示屏,就可以作简单的音乐播放器了, ...

  7. python gui框架_Python的GUI框架PySide的安装配置教程

    (一)说在前面 Python自带了GUI模块Tkinter,只是界面风格有些老旧.另外就是各种GUI框架了. 之前安装过WxPython,并做了简单的界面.遂最近又重新搜索了一下网上关于Python ...

  8. android用java_原来android不是只能用java写软件

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 We released the first version of the Native Development Kit, a development to ...

  9. kafka 异步发送阻塞_Kafka学习一

    一.github下载kafka的源码 可以看到kafka的源码开源社区是非常活跃的. 二.搭建kafka环境 构建kafka环境,首先需要安装Scala和gradle,再安装的scala插件需要和你的 ...

最新文章

  1. 显示ip的img的url
  2. git commit -m 与 git commit -am 的区别
  3. KeeSoft.DBHelper.DBFactory 数据库访问类
  4. Java Review - 并发编程_ScheduledThreadPoolExecutor原理源码剖析
  5. 我们是否能信任算法?不信任又能怎么办?
  6. kmeans算法实例及python代码-Python实现k-means算法
  7. 云服务器定时启动程序_过去、现在和未来:开发一款微信小程序的技术迭代全过程...
  8. 如何在cocoapods中使用更新版本的pod
  9. 把感知机组装在一起就是神经网络了?
  10. python编程可以自学么-怎么能学习好python编程?有自学的方法吗?
  11. [翻译] UPCardsCarousel
  12. sql执行遇到汉字会停止执行吗_(数据)产品经理应该学会的SQL优化和进阶技巧...
  13. 定制自己的Unity场景编辑工具界面(一)
  14. 国内大公司的开源项目一览表
  15. Linux中源码的安装
  16. android_adb pm和adb am +启动/杀死app进程
  17. 微信小程序图片加载错误,显示优化
  18. TCP 三次握手和四次挥手,中间失败了会发生什么?
  19. 技术管理进阶——团队合并、解散怎么办?
  20. 1. 代码效率优化方法论

热门文章

  1. WordPress病毒杂志主题King V6.5 英文Nulled版
  2. python遇到对象_### python面对对象小汇总 #####
  3. mysql create database to_mysql之CREATE DATABASE Syntax(创建数据库)
  4. 微型计算机的机箱内硬件系统,计算机硬件系统(教案) 机箱内的秘密
  5. 服务器不删档的设置_不删档预捏脸开启,快来体验次世代黑科技!
  6. 叮咚酒店营销版小程序v8.5.8+前端
  7. 很漂亮个人主页自带音乐源码
  8. Firefox必备的24款web开发插件[转]
  9. Ubuntu 16.04 安装第三方Apps Can’t Install Third-Party Apps on Ubuntu 16.04? You’re No
  10. 减少HTTP请求(大型网站优化技术)