对于生产环境的集群, 我们可能希望当任何节点出现错误时, 我们能够发现并响应。但如果同时监控多个机器,多个端口不是很合理。
现在我们看db.snapshot(SDB_SNAP_SYSTEM )中有一项"ErrNodes": [], 这个能反映出协调、编目、数据等任意节点(不分主备)down掉时候的状态么?如果可以的话, 我们写脚本监控就会变得很简单了。另外下面这个页面描述的shell脚本还能运行么?试了下, 会hung住
http://www.sequoiadb.com/cn/index.php?a=index&m=Files&cat_id=1432190671&edition_id=0
进程异常退出的时候sdbcm会自动拉起来。可以把日志里的关键字对接到一个告警系统里。
目前快照没法反应catalog和coord的状态。
恩, 好的, 想问下文档中提到的在shell脚本中, 使用bin/sdb的命令这个可以做到么?如果可以的话,我们也可以连到组或节点查看状态。
sdb shell有多种启动模式。 直接运行是交互式的。也可以sdb -f a.js.或者直接在shell里sdb "var db = new Sdb()"这种方式。后台会启动一个sdbbp来保存当前命令的上下文。