在这里,我们有一些服务器,几乎每个服务器都有一个专用的 UPS。它们之间存在依赖关系,因此必须以正确的顺序打开它们。最终,我们遇到了严重的电源问题,因此服务器关闭,然后在恢复电源时以随机顺序重新启动。如果服务器在停电期间关闭,这不是问题,重要的是一旦恢复电源,它们就可以在没有任何人为干预的情况下正常工作。
我们的 UPS 非常便宜,对我的目标有用的唯一配置参数是power the load xx seconds after power is restored
. 理论上,在每个 UPS 上设置正确的延迟,我可以修复服务器重启的顺序,但我不相信 UPS 会按预期运行。
这是正确的方法吗?
高级 UPS 是否提供其他选项来修复重启顺序?
最后一点:我的 Ups 在 1000 - 2200 VA 范围内
对此的标准答案是“一点也不”。修复软件以随机顺序处理重启。如果您确实需要首先启动某些服务器(例如:Active Directory),请将它们放在可能存活更长时间的 USV 上。基于低功耗原子的服务器足以作为 Active Directory 控制器,并且可以在小型 USV 上存活一天。
不,我会说通常假设程序员有足够的能力正确解决这个问题。
你可以做的是:
我会说这种类型的设置更为常见。我会称任何需要服务器以特定顺序(在纯基础架构之外)启动的软件都已损坏且不适合业务。
请注意:我们自己的设置是用于服务器的低成本 20kva USV(成本低,因为我们使用了一个),为作为网络“根”的机器(和备份机器)使用从属的 2000VA USV。从动意味着 USV 落后于大的 - 所以它只在大的(持续半小时到 8 小时,具体取决于我们的计算网格有多少在线)进入终端关闭时才切换到电池。
托管配电单元(而不是 UPS)通常支持在恢复供电后启用各个插座的定制延迟。
通常,这是为了防止断路器在充满系统的机柜在电源恢复后立即同时通电时跳闸,但这也可用于保留系统依赖项的引导顺序。
我有这个确切的问题。唯一的区别是我们投资了坚固的机架式 APC 电源装置(例如APC SmartUPS 3000)。使用 APC PowerChute 网络关闭软件(PowerChute Network Shutdown 软件),我可以按特定顺序关闭和启动服务器。该软件的另一个方便的功能是将服务器设置为在最后一刻关闭,即计算 APC 单元剩余的电池电量,并在有足够的时间让服务器正常关闭而不是关闭电源时关闭服务器。
该软件......不是用户友好的,但如果您花一些时间弄清楚它并不难。如果您有兴趣在基础设施上进行更多投资,那么这绝对是您的必经之路。
听起来 UPS 设备成本低,并且无法在恢复供电后配置特定的输出等待时间(一些高端设备是这样)。要获得相同的功能,您需要选择一个特定的主机以始终立即开机(可能随时允许启动任何系统)并让所有其他服务器处于关机状态(在 bios 中配置为返回电源应用交流电时关闭,并尊重 Wake On Lan 魔术包,以便在被告知这样做时打开电源)。然后,在启动的主主机上,运行脚本/实用程序来计时将 WOL 魔术包传输到每个主机。