Zookeeper启动流程
zookeeper服务器有4个状态:
LOOKING:寻找LeaderFOLLOWING:作为FollowerLEADING:作为LeaderOBSERVING:作为Observer
集群版zk服务器启动状态:
初始化Leader选举,这期间包括给自己投一票注册JMX服务检测当前服务器的状态,初始化一般时LOOKINGLeader选举过程同步状态向外界提供服务
Leader选举方法
几个概念:
vote_sid:接收到投票的服务器idself_sid:自己服务器的idvote_zxid:接收到投票的服务器zxidself_zxid:自己的zxid
选举过程:
每个服务器初始化先给自己投一票,并把投票向集群广播接收其它服务器的投票,4种情况: vote_zxid > self_zxid:认可投票,并转发结果vote_zxid < self_zxid:不认可投票,保持不变vote_zixd = self_zixd && vote_sid > self_zxid:认可投票,并转发结果voite_zixd = self_zxid && vote_sid < self_zxid:保持不变 经过这一轮投票,获得半数以上的服务器成为leader,并广播状态,其余的是follower
之后,所有的Follower,向leader注册,主要是把自己的信息发给leader,包括当前的sid和最新的zxid。
leader获取信息后,计算epoch
,如果follower的epoch
更大,则更新epoch = epoch + 1
。计算完成后,向qita机器发送,接收到ACK之后,就可以进行数据同步了。只要有半数以上的机器收到ACK,则整个集群就启动了。
对于正常集群,如果有新的机器加入,则使用现有的Leader,如果现有的Leader挂掉,则由一台服务器发起投票,走上述的流程,重新进行leader选举。