固件在更新方面很少受到关注。眼不见,心不烦。
许多设备:RAID 控制器、网卡、芯片组,甚至硬盘驱动器,都从更新中获益。更好的功能、安全/错误修复等。
大多数 SA 说,“只要它坏了,就更新固件。” 但这可能会导致困难。有好几次,当我就硬盘故障与戴尔联系时,有人问我我的硬盘固件是否是最新的。我所有的服务器都使用某种类型的 RAID 配置。如果我已经有一个驱动器故障,我是否应该考虑尝试升级其余驱动器或 RAID 控制器上的固件?我会说不。但戴尔似乎有不同的看法。
- 系统固件的实际更新时间表是什么?
- 你有什么最佳实践可以分享吗?
(我知道戴尔有一个很好的实用程序,称为Server Update Utility,它可以检查任何戴尔服务器上的所有新固件。)
我在两个关键实例中更新固件。
我没有在上面列出第三个实例,因为它还没有发生:
我们使用 HP SIM(System's Insight Manager)推出固件,我们按平台进行 - 先测试,然后开发,然后集成,然后参考,最后生产 - 通常每个平台大约一周左右,所以我们有 5/6周发布到生产窗口。似乎可行,但我们从不做的一件事是在推出固件的同时推出其他更新,如驱动程序/代码等 - 节省了大量的指责。
我可能在这里违背了谷物,但如果它没有坏,请不要修复它。如果这不是安全问题,那么我就不管它了。
我从来没有因为这个原因拒绝过戴尔的服务。
也许您可以每月安排一次实用程序,然后通过其他重新启动来更新它们?
您应该像对待补丁一样对待固件更新,尽管这些更新通常更难部署,因此您可能需要查看发行说明以帮助确定是否值得付出努力(但话又说回来,您可能也会为补丁这样做)。 固件更新与修复一个新的令人讨厌的错误一样可能包含一个新的令人讨厌的错误。
在调试(或重新调试硬件)时应该更新固件,因为这样做很容易。
部署应大致遵循以下原则:
话又说回来,有些事情不能遵循这一点。特别是,快速将 Microsoft 补丁推送到 Windows 桌面非常重要,如果没有大量资源,很难快速进行测试。
在调试任何新的基础设施设备时,我通常会更新固件。工作站和打印机仅在存在特定问题(例如所需的错误修复或安全问题)时才会更新。对于服务器来说它不太重要,因为在大多数情况下,固件代码要么不会在引导过程之外执行,要么非常简单,几乎不会出错。
我在服务器上升级 RAID 固件的经历很糟糕,因为许多制造商不保证如果固件版本发生变化,当前的 RAID 配置将是可行的,阵列中的单个磁盘也是如此。
我的倾向是在大多数情况下采用“如果它没有坏,就不要修复它”的政策。值得检查是否可以从错误的固件升级中恢复(即 HP 服务器中的冗余 ROM,或者您是否有 EEPROM 闪存并愿意使用可移动芯片)。
我不能谈论戴尔,但多年前 IBM 存储集团内部的人告诉我,他们的 RAID 固件的第一级从来都不是性能最好的。他们首先追求稳定性,然后根据未来的转速提高性能。不幸的是,除非出现问题,否则我们中很少有人会想到(或者可能有 moxie)稍后返回并弄乱健康系统的 RAID 固件。因此,我们的策略是在每次设置新服务器时升级 RAID 固件级别,假设 RAID 适配器不是全新的品牌。这样,我们至少可以获得当时可用的最佳性能水平。如果它是一个新的模式适配器,我们会尝试在几个月后返回并检查更新,但我们并不相信它。
在主板上,除非供应商技术支持告诉我们,否则我们不会乱用它们。我们多年来的经验是,除非存在需要解决的具体问题,否则风险远远超过难以衡量的收益。
//spk
我已经成功使用了 SUU 以及 HP 和 IBM 的类似产品。我遇到的唯一问题是使用供应商驱动程序替换戴尔驱动程序时,没有技术原因,这导致 SUU 升级无法在戴尔服务器上进行 OM 升级。我们每年至少两次在数百台服务器上运行固件和驱动程序更新,以保持它们都是最新的。我们从未遇到过 RAID 固件的问题。
我们一有机会就更新固件,遗憾的是,对于某些系统,这可能是每年 3-4 次(主要维护窗口)。
如果您阅读戴尔固件升级随附的宣传语,您会发现它将更新分类为关键、重要或其他类别,并描述了升级修复的内容(并不总是像人们希望的那样清晰!)。
我的观点是,如果没有很好的理由,我不会应用固件升级。如果这是一个关键更新并解决了我有合理机会遇到的问题,那么是的,即使这是一项压力很大的业务,我也会应用它。
正如您所说,戴尔支持通常会坚持在支持您之前应用任何相关升级,显然在这种情况下您没有太多选择。你可以理解戴尔不想浪费工程师的时间,尽管我从来不知道固件是支持电话的原因。
JR
我认为这取决于您必须处理的环境类型。如果您在需要高可用性的环境中工作并且您无法在需要时重新启动服务器。我认为最好的做法是实施维护计划。为每个系统选择一个时间范围,通知用户并在此分配的时间范围内执行所有必要的工作,包括固件更新。通过这种方式,您可以确定您的所有系统都是最新的,并同时最大限度地减少对生产的影响。此外,正如前面评论中所指出的,在构建新服务器时有必要检查固件更新。