发布时间:2023-01-30 文章分类:编程知识 投稿人:赵颖 字号: 默认 | | 超大 打印
目录
  • ZooKeeper 是什么?
  • Zookeeper的用途,使用场景
  • zookeeper集群

    • zookeeper集群角色
    • zookeeper集群工作原理
    • zookeeper集群选举的原理
  • zookeeper watcher机制

    • 客户端注册 Watcher
    • 服务端触发 Watcher
  • zookeeper宕机处理

ZooKeeper 是什么?

ZooKeeper 是一个开源的分布式协调服务。它是一个为分布式应用提供一致性服务的软件。

Zookeeper的用途,使用场景

分布式应用程序可以基于 Zookeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、分布式锁和分布式队列等功能。

ZooKeeper 的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

zookeeper集群

zookeeper集群架构图
Zookeeper集群

zookeeper集群角色

zookeeper集群角色
角色 描述
领导者(leader) 领导负责投票发起和决议,更新集群状态
学习者(Learner) 跟随者(follower) follower用于接收客户端请求并向客户端返回结果,参与选举投票
观察者(observer) observer接收客户端连接,将请求转给leader,不参与投票、只同步leader状态。存在是为了扩展集群响应速度
客户端(client) 请求发起方

zookeeper集群工作原理

Zookeeper的核心是原子广播,这个机制保证了各个Server之间的同步。实现这个机制的协议叫做Zab协议

Zab协议有两种模式,它们分 别是恢复模式(选主)广播模式(同步)。当服务启动或者在领导者崩溃后,Zab就进入了恢复模式,当领导者被选举出来,且大多数Server完成了和 leader的状态同步以后,恢复模式就结束了。恢复模式结束后,Zab进入广播模式,状态同步保证了leader和Server具有相同的系统状态。

为了保证事务的顺序一致性,zookeeper采用了递增的事务id号(zxid)来标识事务。所有的提议(proposal)都在被提出的时候加上 了zxid。实现中zxid是一个64位的数字,它高32位是epoch用来标识leader关系是否改变,每次一个leader被选出来,它都会有一个 新的epoch,标识当前属于那个leader的统治时期。低32位用于递增计数。

每个Server在工作过程中有三种状态:

zookeeper集群选举的原理

半数通过

当leader崩溃或者leader失去大多数的follower,这时候zk进入恢复模式,恢复模式需要重新选举出一个新的leader,让所有的 Server都恢复到一个正确的状态。

Zk的选举算法有两种:一种是基于basic paxos实现的,另外一种是基于fast paxos算法实现的。系统默认的选举算法为fast paxos

zookeeper watcher机制

Zookeeper 允许客户端向服务端的某个 Znode 注册一个 Watcher 监听,当服务端的一些指定事件触发了这个 Watcher,服务端会向指定客户端发送一个事件通知来实现分布式的通知功能,然后客户端根据 Watcher 通知状态和事件类型做出业务上的改变。

工作机制

Watcher 特性总结

客户端注册 Watcher

服务端触发 Watcher

zookeeper宕机处理

Zookeeper 本身也是集群,推荐配置不少于 3 个服务器。Zookeeper 自身也要保证当一个节点宕机时,其他节点会继续提供服务。

如果是一个 Follower 宕机,还有 2 台服务器提供访问,因为 Zookeeper 上的数据是有多个副本的,数据并不会丢失;如果是一个 Leader 宕机,Zookeeper 会选举出新的 Leader。

ZK 集群的机制是只要超过半数的节点正常,集群就能正常提供服务。只有在 ZK节点挂得太多,只剩一半或不到一半节点能工作,集群才失效。

所以: