ZooKeeper实现同步屏障(Barrier)
按照维基百科的解释:同步屏障(Barrier)是并行计算中的一种同步方法。对于一群进程或线程,程序中的一个同步屏障意味着任何线程/进程执行到此后必须等待,直到所有线程/进程都到达此点才可继续执行下文。
在ZK官网https://zookeeper.apache.org/doc/current/zookeeperTutorial.html ,提供了一个示例实现,但这个例子比较复杂,代码同时包括了Barrier和Queue两种实现,对例子做了修改,仅介绍Barrier的实现。
使用请客吃饭的场景:一张桌子坐四个人,四个人都到齐后,才能开饭;四个人都吃完以后,才能离开。
1 实现原理
为一个餐桌创建一个节点如/table-3,每一个客人是它的一个子节点/table-3/张三。所有客人都监听/table-3的事件,收到事件后检查子节点个数,如果达到要求的人数就开饭;当吃完以后,删除自己的子节点,并继续监听/table-3的事件,当子节点个数为0时,退出程序。
2 客人落座
落座的流程分两步:首先,创建自己的子节点;然后,等待其他客人落座直到坐满。创建客人子节点时CreateMode使用的是CreateMode.EPHEMERAL,这是属于当前zk会话的节点,当会话关闭时,如果节点没有删除,ZK会自动删除。
String nodeName = tableSerial + “/” + customerName; log.info(“{}: 自己坐下来 {}”, customerName, nodeName); zk.create(nodeName, new byte[0], Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL); while (true) { synchronized (mutex) { // 读出子节点列表,并继续监听 List<String> list = zk.getChildren(tableSerial, true); if (list.size() < tableCapacity) { log.info(“{}: 当前人数 = {} , 总人数 = {}, 人还不够: 吃饭不积极,一定有问题…”, customerName, list.size(), tableCapacity); mutex.wait(); } else { log.info(“{}: 人终于够了,开饭…”, customerName); return true; } } } |
3 客人准备离开
客人准备离开的逻辑同落座类似,首先删除自己的子节点,然后判断是否所有的子节点都已经被删除。删除子节点时,直接设置版本号为0,这是因为在这个示例中创建后没有修改过数据。真实业务场景,应该先读出zk中数据的版本号,然后作为参数传入到delete命令。
String nodeName = tableSerial + “/” + customerName; log.info(“{}: 已经吃完,准备离席,删除节点 {}”, customerName, nodeName); zk.delete(nodeName, 0); while (true) { // 读出子节点列表,并继续监听 List<String> list = zk.getChildren(tableSerial, true); if (list.size() > 0) { log.info(“{}: 还有 {} 人没吃完,你们吃快点…”, customerName, list.size()); synchronized (mutex) { mutex.wait(); } } else { log.info(“{}: 所有人都吃完了,准备散伙”, customerName); return true; } } |
4 尝试用Stat获取子节点个数
代码中使用getChildren获取子节点列表,然后统计个数。ZooKeeper还有另一个方法也能获取子节点数:org.apache.zookeeper.data.Stat#numChildren。
将代码leave修改为
String nodeName = tableSerial + “/” + customerName; log.info(“{}: 已经吃完,准备离席,删除节点 {}”, customerName, nodeName); zk.delete(nodeName, 0); while (true) { // 使用Stat判断子节点个数 Stat tableStat = new Stat(); zk.getData(tableSerial, true, tableStat); if (tableStat.getNumChildren() > 0) { log.info(“{}: 还有 {} 人没吃完,你们吃快点…”, customerName, tableStat.getNumChildren()); synchronized (mutex) { mutex.wait(); } } else { log.info(“{}: 所有人都吃完了,准备散伙”, customerName); return true; } } |
运行后发现:能够读出子节点个数,但再也无法监听 EventType.NodeChildrenChanged事件,这是ZooKeeper的监听机制决定的。网上搜索到 https://my.oschina.net/u/587108/blog/484203 有介绍,可以自己看一下。简单说就是:
getData()和exists()会监听节点自己的NodeCreated、NodeDeleted、NodeDataChanged事件;getChildren()会监听节点的NodeChildrenChanged事件。
5 完整源码
这个例子没有使用main()函数,改为创建一个 testng 测试用例启动。
5.1 ZooKeeperBarrier.java
package tech.codestory.zookeeper.barrier;
import java.io.IOException; import java.util.List; import java.util.concurrent.CountDownLatch; import org.apache.zookeeper.*; import org.apache.zookeeper.ZooDefs.Ids; import org.apache.zookeeper.data.Stat; import org.slf4j.profiler.Profiler; import lombok.extern.slf4j.Slf4j;
/** * @author junyongliao * @date 2019/8/13 * @since 1.0.0 */ @Slf4j public class ZooKeeperBarrier implements Watcher { /** 等待连接建立成功的信号 */ CountDownLatch connectedSemaphore = new CountDownLatch(1); /** ZooKeeper 客户端 static */ ZooKeeper zk = null; /** 子节点发生变化的信号 static */ Integer mutex; /** 避免重复构建餐桌 */ static Integer tableSerialInitial = Integer.valueOf(1);
/** 餐桌容量 */ int tableCapacity; /** 餐桌编号 */ String tableSerial;
/** 客人姓名 */ String customerName;
/** * 构造函数,用于创建zk客户端,以及记录记录barrier的名称和容量 * * @param address ZooKeeper服务器地址 * @param tableSerial 餐桌编号 * @param tableCapacity 餐桌容量 * @param customerName 客人姓名 */ ZooKeeperBarrier(String address, String tableSerial, int tableCapacity, String customerName) { this.tableSerial = tableSerial; this.tableCapacity = tableCapacity; this.customerName = customerName;
try { Profiler profiler = new Profiler(customerName + ” 连接到ZooKeeper”); profiler.start(“开始连接”); zk = new ZooKeeper(address, 3000, this);
profiler.start(“等待连接成功的Event”); connectedSemaphore.await(); profiler.stop(); profiler.setLogger(log); profiler.log();
mutex = Integer.valueOf(-1); } catch (IOException e) { log.error(“IOException”, e); zk = null; } catch (InterruptedException e) { log.error(“InterruptedException”, e); }
synchronized (tableSerialInitial) { // 创建 tableSerial 的zNode try { Stat existsStat = zk.exists(tableSerial, false); if (existsStat == null) { this.tableSerial = zk.create(tableSerial, new byte[0], Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT); } } catch (KeeperException e) { log.error(“KeeperException”, e); } catch (InterruptedException e) { log.error(“InterruptedException”, e); } } }
@Override public void process(WatchedEvent event) { if (Event.EventType.None.equals(event.getType())) { // 连接状态发生变化 if (Event.KeeperState.SyncConnected.equals(event.getState())) { // 连接建立成功 connectedSemaphore.countDown(); } } else if (Event.EventType.NodeChildrenChanged.equals(event.getType())) { log.info(“{} 接收到了通知 : {}”, customerName, event.getType()); // 子节点有变化 synchronized (mutex) { mutex.notify(); } } }
/** * 客人坐在饭桌上 * * @return 当等到餐桌坐满时返回 true * @throws KeeperException * @throws InterruptedException */ boolean enter() throws KeeperException, InterruptedException { String nodeName = tableSerial + “/” + customerName; log.info(“{}: 自己坐下来 {}”, customerName, nodeName); // 属于客人自己的节点,如果会话结束没删掉会自动删除 zk.create(nodeName, new byte[0], Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL); while (true) { synchronized (mutex) { // 读出子节点列表,并继续监听 List<String> list = zk.getChildren(tableSerial, true); if (list.size() < tableCapacity) { log.info(“{}: 当前人数 = {} , 总人数 = {}, 人还不够: 吃饭不积极,一定有问题…”, customerName, list.size(), tableCapacity); mutex.wait(); } else { log.info(“{}: 人终于够了,开饭…”, customerName); return true; } } } }
/** * 客人吃完饭了,可以离开 * * @return 所有客人都吃完,再返回true * @throws KeeperException * @throws InterruptedException */ boolean leave() throws KeeperException, InterruptedException { String nodeName = tableSerial + “/” + customerName; log.info(“{}: 已经吃完,准备离席,删除节点 {}”, customerName, nodeName); zk.delete(nodeName, 0); while (true) { // 读出子节点列表,并继续监听 List<String> list = zk.getChildren(tableSerial, true); if (list.size() > 0) { log.info(“{}: 还有 {} 人没吃完,你们吃快点…”, customerName, list.size()); synchronized (mutex) { mutex.wait(); } } else { log.info(“{}: 所有人都吃完了,准备散伙”, customerName); return true; } } } } |
5.2 ZooKeeperBarrierTest.java
package tech.codestory.zookeeper.barrier;
import lombok.extern.slf4j.Slf4j; import org.apache.zookeeper.KeeperException; import org.testng.annotations.Test; import java.security.SecureRandom; import java.util.Random; import java.util.concurrent.CountDownLatch; import static org.testng.Assert.*;
/** * 测试 ZooKeeperBarrier * * @author code story * @date 2019/8/15 */ @Slf4j public class ZooKeeperBarrierTest { Random random = new SecureRandom();
@Test public void testBarrierTest() { /** 等待连接建立成功的信号 */
String address = “192.168.5.128:2181”; String barrierName = “/table-” + random.nextInt(10); int barrierSize = 4;
CountDownLatch countDown = new CountDownLatch(barrierSize); String[] customerNames = {“张三”, “李四”, “王五”, “赵六”}; for (int i = 0; i < barrierSize; i++) { String customerName = customerNames[i]; new Thread() { @Override public void run() { log.info(“{}: 准备吃饭”, customerName); ZooKeeperBarrier barrier = new ZooKeeperBarrier(address, barrierName, barrierSize, customerName); try { boolean flag = barrier.enter(); log.info(“{}: 坐在了可以容纳 {} 人的饭桌”, customerName, barrierSize); if (!flag) { log.info(“{}: 想坐在饭桌时出错了”, customerName); } } catch (KeeperException e) { log.error(“KeeperException”, e); } catch (InterruptedException e) { log.error(“InterruptedException”, e); }
// 假装在吃饭,随机时间 randomWait();
// 假装吃完了,离开barrier try { barrier.leave(); } catch (KeeperException e) { log.error(“KeeperException”, e); } catch (InterruptedException e) { log.error(“InterruptedException”, e); } countDown.countDown(); } }.start();
// 等一会儿再开始下一个进程 randomWait(); }
try { countDown.await(); log.info(“这一桌吃完了,散伙”); } catch (InterruptedException e) { log.error(“InterruptedException”, e); } }
/** 随机等待 */ private void randomWait() { int r = random.nextInt(100); for (int j = 0; j < r; j++) { try { Thread.sleep(100); } catch (InterruptedException e) { log.error(“InterruptedException”, e); } } } } |
6 测试日志
如下是测试日志
33:34.198 [INFO] ZooKeeperBarrierTest.run(36) 张三: 准备吃饭 33:40.497 [INFO] ZooKeeperBarrierTest.run(36) 李四: 准备吃饭
33:43.333 [DEBUG] ZooKeeperBarrier.log(201) + Profiler [张三 连接到ZooKeeper] |– elapsed time [开始连接] 71.684 milliseconds. |– elapsed time [等待连接成功的Event] 9046.279 milliseconds. |– Total [张三 连接到ZooKeeper] 9118.483 milliseconds.
33:43.346 [INFO] ZooKeeperBarrier.enter(110) 张三: 自己坐下来 /table-2/张三 33:43.353 [INFO] ZooKeeperBarrier.enter(118) 张三: 当前人数 = 1 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题…
33:49.515 [DEBUG] ZooKeeperBarrier.log(201) + Profiler [李四 连接到ZooKeeper] |– elapsed time [开始连接] 4.365 milliseconds. |– elapsed time [等待连接成功的Event] 9011.503 milliseconds. |– Total [李四 连接到ZooKeeper] 9015.873 milliseconds.
33:49.520 [INFO] ZooKeeperBarrier.enter(110) 李四: 自己坐下来 /table-2/李四 33:49.528 [INFO] ZooKeeperBarrier.process(93) 张三 接收到了通知 : NodeChildrenChanged 33:49.528 [INFO] ZooKeeperBarrier.enter(118) 李四: 当前人数 = 2 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题… 33:49.532 [INFO] ZooKeeperBarrier.enter(118) 张三: 当前人数 = 2 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题… 33:50.107 [INFO] ZooKeeperBarrierTest.run(36) 王五: 准备吃饭 33:50.307 [INFO] ZooKeeperBarrierTest.run(36) 赵六: 准备吃饭
33:59.122 [DEBUG] ZooKeeperBarrier.log(201) + Profiler [王五 连接到ZooKeeper] |– elapsed time [开始连接] 4.956 milliseconds. |– elapsed time [等待连接成功的Event] 9008.505 milliseconds. |– Total [王五 连接到ZooKeeper] 9013.468 milliseconds.
33:59.125 [INFO] ZooKeeperBarrier.enter(110) 王五: 自己坐下来 /table-2/王五 33:59.128 [INFO] ZooKeeperBarrier.process(93) 张三 接收到了通知 : NodeChildrenChanged 33:59.132 [INFO] ZooKeeperBarrier.process(93) 李四 接收到了通知 : NodeChildrenChanged 33:59.133 [INFO] ZooKeeperBarrier.enter(118) 李四: 当前人数 = 3 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题… 33:59.135 [INFO] ZooKeeperBarrier.enter(118) 王五: 当前人数 = 3 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题… 33:59.136 [INFO] ZooKeeperBarrier.enter(118) 张三: 当前人数 = 3 , 总人数 = 4, 人还不够: 吃饭不积极,一定有问题…
33:59.335 [DEBUG] ZooKeeperBarrier.log(201) + Profiler [赵六 连接到ZooKeeper] |– elapsed time [开始连接] 10.184 milliseconds. |– elapsed time [等待连接成功的Event] 9014.981 milliseconds. |– Total [赵六 连接到ZooKeeper] 9025.175 milliseconds.
33:59.339 [INFO] ZooKeeperBarrier.enter(110) 赵六: 自己坐下来 /table-2/赵六 33:59.343 [INFO] ZooKeeperBarrier.process(93) 张三 接收到了通知 : NodeChildrenChanged 33:59.345 [INFO] ZooKeeperBarrier.enter(122) 赵六: 人终于够了,开饭… 33:59.346 [INFO] ZooKeeperBarrierTest.run(41) 赵六: 坐在了可以容纳 4 人的饭桌 33:59.346 [INFO] ZooKeeperBarrier.process(93) 王五 接收到了通知 : NodeChildrenChanged 33:59.346 [INFO] ZooKeeperBarrier.process(93) 李四 接收到了通知 : NodeChildrenChanged 33:59.348 [INFO] ZooKeeperBarrier.enter(122) 王五: 人终于够了,开饭… 33:59.348 [INFO] ZooKeeperBarrierTest.run(41) 王五: 坐在了可以容纳 4 人的饭桌 33:59.350 [INFO] ZooKeeperBarrier.enter(122) 李四: 人终于够了,开饭… 33:59.350 [INFO] ZooKeeperBarrierTest.run(41) 李四: 坐在了可以容纳 4 人的饭桌 33:59.352 [INFO] ZooKeeperBarrier.enter(122) 张三: 人终于够了,开饭… 33:59.352 [INFO] ZooKeeperBarrierTest.run(41) 张三: 坐在了可以容纳 4 人的饭桌 33:59.646 [INFO] ZooKeeperBarrier.leave(138) 赵六: 已经吃完,准备离席,删除节点 /table-2/赵六 33:59.650 [INFO] ZooKeeperBarrier.process(93) 赵六 接收到了通知 : NodeChildrenChanged 33:59.651 [INFO] ZooKeeperBarrier.process(93) 张三 接收到了通知 : NodeChildrenChanged 33:59.652 [INFO] ZooKeeperBarrier.leave(144) 赵六: 还有 3 人没吃完,你们吃快点… 33:59.652 [INFO] ZooKeeperBarrier.process(93) 李四 接收到了通知 : NodeChildrenChanged 33:59.652 [INFO] ZooKeeperBarrier.process(93) 王五 接收到了通知 : NodeChildrenChanged 33:59.654 [INFO] ZooKeeperBarrier.leave(144) 赵六: 还有 3 人没吃完,你们吃快点… 34:04.356 [INFO] ZooKeeperBarrier.leave(138) 王五: 已经吃完,准备离席,删除节点 /table-2/王五 34:04.361 [INFO] ZooKeeperBarrier.process(93) 赵六 接收到了通知 : NodeChildrenChanged 34:04.363 [INFO] ZooKeeperBarrier.leave(144) 王五: 还有 2 人没吃完,你们吃快点… 34:04.363 [INFO] ZooKeeperBarrier.leave(144) 赵六: 还有 2 人没吃完,你们吃快点… 34:05.958 [INFO] ZooKeeperBarrier.leave(138) 张三: 已经吃完,准备离席,删除节点 /table-2/张三 34:05.963 [INFO] ZooKeeperBarrier.process(93) 王五 接收到了通知 : NodeChildrenChanged 34:05.961 [INFO] ZooKeeperBarrier.leave(138) 李四: 已经吃完,准备离席,删除节点 /table-2/李四 34:05.967 [INFO] ZooKeeperBarrier.leave(144) 张三: 还有 1 人没吃完,你们吃快点… 34:05.968 [INFO] ZooKeeperBarrier.process(93) 赵六 接收到了通知 : NodeChildrenChanged 34:05.971 [INFO] ZooKeeperBarrier.process(93) 张三 接收到了通知 : NodeChildrenChanged 34:05.973 [INFO] ZooKeeperBarrier.leave(149) 赵六: 所有人都吃完了,准备散伙 34:05.981 [INFO] ZooKeeperBarrier.leave(149) 王五: 所有人都吃完了,准备散伙 34:05.982 [INFO] ZooKeeperBarrier.leave(149) 张三: 所有人都吃完了,准备散伙 34:05.983 [INFO] ZooKeeperBarrier.leave(149) 李四: 所有人都吃完了,准备散伙 34:05.985 [INFO] ZooKeeperBarrierTest.testBarrierTest(72) 这一桌吃完了,散伙 |