最近在之前搭建的集群中添加新的机器,原本很简单的东西,但是由于各种原因,出现了各种问题,也花费了不少时间,这里记录下,也方便他人解决相同的问题;
首先,在机器上添加编码节点,start后,相应的进程以及起来了,但是WEB显示没有启动成功。查看日志,发现以下错误信息:Send message to catlog[oamdev:11803] failed[rc:-15]. It is possible because the remote service was not started yet~
核查原因:新的机器上的hosts文件没有配置oamdev,其对应IP配置的是另外的hostname,
解决方式:hosts文件新增oamdev与IP的映射关系;
修改后,认为总该没问题了吧,接着又出现了这样的错误:
Error: Start [/sequoiadb/bin/../conf/local/11800] failed, rc: 138(Catalog authentication failed)
核查原因:添加编码节点使用的hostname与实际的hostname不一致,从而导致;
解决方式: 使用新机器对应的hostname作为参数创建节点;
总结建议:
1 集群中所有/etc/hosts配置建议一致
2 /etc/hosts配置主机名与机器的hostname一致