有一台带有 2 个 CPU(Intel Xeon E5-2670、Sandy Bridge)和 1 个 AMD GPU(Tahiti XT Radeon HD 7970)的服务器。还有SSD(系统和可执行文件)和HDD(大数据)连接到这个服务器。
有时服务器在高负载下工作几个小时。有时服务器空闲几个小时(空闲可能超过 8 小时)。
我听到了两种相反的观点:
- 我不应该关闭我的服务器,因为服务器设计为无需关闭即可工作。数以千计的服务器没有关闭并连续工作一个月。
- 如果没有负载,则应关闭服务器。特别是因为 GPU。GPU 和 GPU 散热器的资源有限,即使 GPU 负载不重,一直打开 GPU 也不好。
哪个意见是对的?我是否应该关闭此服务器以显着延长其使用寿命?
UPD 1我首先想知道 GPU 的不间断工作。
UPD 2关于 GPU 选择。这不仅仅是游戏 GPU。Radeon 7970 在某些情况下击败了例如 Nvidia Kepler。见介绍。
UPD 3有一种观点认为,基于 GPU 的机器在 IDLE 上打开是非常糟糕的策略。我试图理解是真实的观点还是虚假的
空闲时关闭服务器的优点:
空闲时关闭服务器的缺点:
大多数系统中只有风扇和硬盘驱动器具有电机。硬盘电机受到良好的环境保护,但风扇暴露在空气中的所有灰尘中。因此,与其他部件相比,它们磨损得很快。这就是为什么在大多数服务器中它们是可热插拔的——您可以在不关闭服务器的情况下更换它们。还有比实际需要更多的风扇,因此单个风扇故障不会导致系统过热。
但是,这并不意味着关闭它们一定是一件好事。大多数开始磨损的风扇一旦加快速度就可以正常工作,但启动时遇到麻烦。因此,当服务器重新打开时,它们将根本无法启动,但如果一直保持打开状态,它们可能会继续运行。
关于显卡的具体想法:
所有显卡在空闲时都会减慢风扇速度并降低功耗。如果您的意思是“经过 1 万亿次计算,显卡就会死机”,并不是“GPU 资源的限制”,但它上的风扇在出现故障之前运行的小时数肯定是有限的。在台式机方面,我有很多带有专用显卡的系统,在显卡迷死之前,它们几乎 24x7 运行了 2-3 年。在实际的服务器机房环境中,希望与桌面环境相比,热量和灰尘更少,我希望它可以在没有维护的情况下运行很长时间。但以防万一,我会为它订购几个替换风扇,这样如果它死了,我就准备好一个。
结论