有时,服务器会开始显示某种硬件故障,而不是禁用其功能,但需要亲自到场(如果远程发布,可能需要几天才能到达)。
在某些这样的情况下,服务器必须保持开启以保留一些内部状态:它不能关闭电源,也不能重新启动,但同时,它必须处于尽可能空闲的状态,并试图保持开启直到技术到达。
目前我们手动禁用所有服务,包括数据库、系统日志等。有时它们有几十个,我们必须密切关注打开或关闭的内容。
我知道这一点,但它没有多大帮助。
有没有办法以编程方式执行此操作,记录启用的内容,以便在服务器状况改善时正确重新启动此类服务?
我对任何操作系统的答案感兴趣,但也可能对基于 illumos 的金属上操作系统(SmartOS / OmniOS)感兴趣,因为这是我们正在使用的设置。