以下教程是我一年前留下的文档,仅供参考
----------------------分割线----------------------
SequoiaDB 集群掉电,手动恢复教程
当机房掉电,使得整个 SequoiaDB 集群同时异常停止,再次通电后,由 sdbcm 进程启动的各个 SequoiaDB 进程无法正常启动。
环境:
三台机器:master,slave1,slave2
解决方法:(三台机器中随意选择一台机器操作)
1 切换用户
su - sdbadmin
2 切换路径
cd /opt/sequoiadb
3 确定catalog 节点的端口号(此处默认catalog 的端口为11800)
1) vi conf/local/11800/sdb.conf
2) 查看 role=catalog ,则说明此配置文件为catalog的
3) 确认catalog 端口,svcname=11800
4 停止 sdbcm
bin/sdbcmtop
5 查找 pid 并停止catalog
1) 查找catalog 的pid
ps -ef| grep sequoiadb\(11800 | grep sdbadmin | awk '{print $2}'
2) 停止catalog
kill `ps -ef| grep sequoiadb\(11800 | grep sdbadmin | awk '{print $2}'`
6 恢复一个编目节点
1) 启动catalog
bin/sdbstart -c conf/local/11800/ -o standalone
2) 通过日志文件查看catalog是否恢复成功
vi database/11800/diaglog/sdbdiag.log
如果日志文件最末尾出现:"Dps restore succeed",则代表恢复成功
7 停止catalog
bin/sdbstop -p 11800
SequoiaDB 集群恢复
三台机器重启 sdbcm 进程
service sdbcm restart