我有两个节点,完整的 IP 故障转移对它们非常有效 - 当节点 1 关闭时,节点 2 获取 IP 并启动服务。
我想知道的是:
如果服务器1没有完全崩溃,只是其中一个服务意外停止,是否可以配置heartbeat来监视它并启动它?
编辑:起搏器有可能吗?
引自http://clusterlabs.org/wiki/FAQ#Organizational
Pacemaker 在您的应用程序或运行它们的机器发生故障时让您的应用程序保持运行
我有两个节点,完整的 IP 故障转移对它们非常有效 - 当节点 1 关闭时,节点 2 获取 IP 并启动服务。
我想知道的是:
如果服务器1没有完全崩溃,只是其中一个服务意外停止,是否可以配置heartbeat来监视它并启动它?
编辑:起搏器有可能吗?
引自http://clusterlabs.org/wiki/FAQ#Organizational
Pacemaker 在您的应用程序或运行它们的机器发生故障时让您的应用程序保持运行
当然,heartbeat version 2可以做到。
对于版本 1,您
/etc/ha.d/haresources
看起来像这样:然后你可以通过运行生成 heartbeat 2 配置文件:
/var/lib/heartbeat/crm/cib.xml
但我建议你应该选择
corosync
andPacemaker
。不要使用 Heartbeat (v2)。完全没有。立即远离它,使用 Pacemaker 作为集群资源管理器,使用 Corosync 作为消息传递层。您甚至不会在任何各种 Linux HA 社区渠道中找到对 Heartbeat v2 的支持,事实上,您可能会因为使用过时的技术而大喊大叫。Pacemaker 和 Corosync 是 Heartbeat 的完美继承者。
Pacemaker 是Linux HA 堆栈的集群资源管理器,专为满足您的要求而设计。它监视资源(IP 地址、服务、文件系统、挂载点、路由……),并且可以并且将在它们失败时尝试重新启动它们。当然,它的作用远不止于此。
我将在这里链接我之前的一个答案,因为没有必要进一步重复我自己: Heartbeat will't successfully start up resources from a cold boot when a failed node is present