AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 627596
Accepted
C-Otto
C-Otto
Asked: 2014-09-11 07:44:23 +0800 CST2014-09-11 07:44:23 +0800 CST 2014-09-11 07:44:23 +0800 CST

哪种 STONITH 硬件可用于电力围栏?

  • 772

我想使用 corosync/pacemaker/drbd 设置一个两节点的高可用性集群。为此,当然,我需要击剑。据我了解,所有 IPMI/iLO/... 解决方案都可以完成这项工作,但前提是机箱有电源。在节点 B 断电的情况下,节点 A 没有任何机会对节点 B 使用 STONITH。

什么样的硬件可以解决这个问题?是否有(标准机架)服务器提供 IPMI/iLO/... 使用电池运行的硬件?我应该使用联网的 UPS 吗?

hardware
  • 2 2 个回答
  • 2939 Views

2 个回答

  • Voted
  1. voretaq7
    2014-09-11T08:07:53+08:002014-09-11T08:07:53+08:00

    据我所知,没有标准的硬件(或软件)解决方案。
    如果它不存在,您将无法拍摄头部中的另一个节点。

    您可以通过多种不同的方式来处理这个问题——我可以建议使用智能 PDU——作为最后的手段,当没有其他 STONITH 技术起作用时,它会命令其电源插座“关闭”并且您不必担心它会再次出现直到有人再次命令电源“打开”。(这实际上只是为了防止有人意外拉动电源线......)

    类似的解决方案也可以使用托管交换机关闭机器连接的端口,或者将它们放入“固定器”VLAN,这样您就可以连接到那里的盒子并准备好重新加入集群。


    上述两种想法都依赖于您的数据中心的供电和连接(PDU、交换机等都需要工作,并且需要存在连接,以便您可以向基础设施设备发送命令)。

    如果您不能依赖电源,经典解决方案是将服务器配置为在电源故障后不自动开机(IPMI/iLO/等在机箱通电时仍会出现,因此您可以稍后将其作为手动步骤,可能是在如上所述隔离其网络端口之后)。
    这避免了“坏”节点重新上线,但确实在流程中添加了手动(或自动)步骤。

    如果您的问题是连接性而不是电源问题,那么您将遇到一个更困难的问题 - 断开连接的节点需要向自己的头部开枪。(这个问题就是为什么我的集群配置不会自动重新激活失败的成员:当一个盒子出现故障并返回时,它处于部分在线状态并等待我告诉它重新加入。这是一个手动步骤,但它是一个这不应该以任何频率发生。)

    • 9
  2. Best Answer
    Petter H
    2014-09-11T10:16:53+08:002014-09-11T10:16:53+08:00

    您可以配置基于 iLO/IPMI 的防护,然后使用例如带有 APC 电源开关的 fence_apc 防护代理作为辅助防护设备。这样,如果服务器断电,那么辅助防护代理仍然能够以对集群有意义的方式对服务器进行 STONITH。

    就像这里描述的:

    一个节点可以有多个栅栏方法,每个栅栏方法可以有多个栅栏设备。

    为冗余/保险设置了多种围栏方法。例如,您可能正在对集群中的节点使用基板管理防护方法,例如 IPMI、iLO、RSA 或 DRAC。所有这些都取决于网络连接。如果此连接失败,则无法进行防护,因此作为备用防护方法,您可以声明第二种防护方法,该方法使用电源开关或类似的东西来防护节点。如果第一种方法无法隔离节点,则将采用第二种隔离方法。

    您还可以考虑添加fence_manual作为辅助防护代理,这样您就可以随时恢复集群,但当然需要手动干预。

    • 4

相关问题

  • 如何在 Linux 机器上找到有关硬件的详细信息?

  • 总大小(磁盘)与总大小(媒体)

  • 如何监控系统在哪里写/读磁盘?[关闭]

  • IP-KVM(在我的例子中是 ADDER Ipeps):轻松防火墙穿越

  • 非品牌笔记本电池?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve