为什么学习呢?
因为大数据学习过程中用到了,所以要学习。
这东西能干啥,解决什么问题了?
解决了分布式集群中应用系统一致性问题。(分布式系统中不可避免的数据一致性问题。)
我们学习的目标有哪些?
学习该中间件的简介、环境搭建、使用、内部原理、实战、Hadoop HA、最后企业面试题。
简介
Zookeeper是什么?
zookeeper是一个分布式协调服务的Apache开源项目。主要解决分布式集群中应用系统一致性问题。
zookeeper本质是一个小的分布式文件系统。提供类似linux系统目录树结构数据存储方式。
zookeeper提供客户端监控内部数据的功能,从而达到基于数据的集群管理。从设计模式来看基于观察者模式设计的,接受观察者注册,当数据变化时就会负责通知已经在注册的zk的观察者,并做出相应的动作。
所以大概这么理解zookeeper=文件系统+注册通知功能
Zookeeper的数据结构
数据结构类似linux文件系统。整体是一个树结构。每一个节点称作znode。每一个znode默认存储1MB的数据,每个znode有其路径唯一标识
Zookeeper的特点
1.zookeeper是一个领导者(leader)多个跟随者(follower)组成的集群
2.leader负责进行投票的发起和决议,更新系统状态
3.follower用于接收客户请求并向客户端返回结果,在选举leader过程中参与投票
4.集群中只要半数以上节点存活,zookeeper集群就能正常服务。
5.全局数据一致:每个server保存一份相同的数据副本,client无论连接到那个server,数据都是一致性的。
6.数据更新原子性,一次数据更新要么成功,要么失败。
7.实时性,在一定时间范围内,client能读到最新数据。
8.更新请求顺序进行,来自同一个client的更新请求按其发送顺序依次执行。
Zookeeper应用场景
1.同一命名服务
分布式环境下,经常需要对应用服务进行同一命名,便于识别。例如:ip使用域名
2.同一配置管理
例如 分布式环境,要求每个节点配置信息一致,配置文件修改希望快速同步到各个节点上。
配置管理可以交给zookeeper实现,将配置信息写入到zookeeper的一个znode上。每个客户端节点监听这个znode。一旦znode数据进行修改,zookeeper将通知到各个客户端服务器。
3.同一集群管理
例如 分布式环境中,掌握每个节点的状态,根据节点实时状态做出一些调整。
zookeeper可以实现实时监控节点状态变化,可将节点信息写入到zookeeper上的一个znode上,监听这个znode可获取它的实时状态变化。
4.服务器动态上下线
客户端能实时观察到服务器上下线的变化
通过客户端监控zookeeper上服务器节点上下线事件通知进行观察
5.软负载均衡
在zookeeper中记录每台服务器的访问数,让访问最少的服务器去处理最新的客户端请求。
原文:https://www.cnblogs.com/90java/p/13961755.html