介绍/问题
大家好,
我在这里。
我有一台运行 Windows Server 2003 的戴尔 R300 服务器。它在昨晚很晚时出现故障,在尝试重新启动它时,我收到以下关于安装的 PERC 5e RAID 控制器的错误。
1) 在 Windows 登录屏幕:
Controller event log: BBU disabled, changing WB virtual disks to WT: Controller 0 (PERC 5/E Adapter)
2) 在 R300 服务器前面:
E171F PCIE FATAL ERR B0 D4 F0
我们尝试将 RAID 控制器重新安装在同一个 PCIE 插槽中,没有任何变化。
然后我们尝试将其切换到另一个 PCIe 插槽,但在启动时根本找不到控制器配置,因此我们将其移回原来的插槽。
我启动到 PERC Config BIOS 并看到可能有可用的固件更新。RAID 控制器信息如下:
控制器信息
PERC 5/E
包 5.2.1-0066
固件版本 1.03.40-8316
BIOS 版本 MT28-8
注意事项
我认为这可能是一个坏的 RAID 控制器,我可能需要备份配置并将其导入另一个控制器,但我愿意接受任何建议。
我是否可以进行任何进一步的诊断/故障排除尝试以使此 PERC 5/e 重新联机,或者您认为此控制器是否正常?
是否值得尝试引导到 Dell OpenManage Assistant CD 并查看是否有任何其他选项可用?我不相信我有这个软件随时可用,所以如果可以的话,我可能需要下载并刻录它。
假设这个控制器已经死了,在另一个服务器/控制器上备份和恢复这个配置的步骤是什么?
请原谅我的无知,因为这种级别的故障排除不是我有丰富经验的。
谢谢你的时间,
亚伦
因此,正如您所说,它仍然可以启动到 Windows 登录屏幕,除了您发布的错误消息之外,服务器运行正常吗?
基本上,此错误消息仅告诉您 RAID 控制器的电池已损坏/消失/不存在,并且因此将您的虚拟磁盘缓存模式从write-back 设置为 write-through。这背后的原因是您的控制器缓存不再由 BBU 支持,因此在断电的情况下将其用于写入缓存是不安全的。
目前唯一应该发生的问题是写入性能略有下降。
通常 PERC5 也会在启动时发出哔哔声,我很确定他们也有一个关于电池低功耗的特殊错误消息,这让我认为在你的情况下:
最后没有什么可担心的——从另一台服务器上拉一个工作的 BBU / 控制器,或者在 ebay 上给自己一个。
BBU 电池耗尽是任何控制器的一个非常常见的问题(锂离子电池会随着时间的推移而磨损),这也是为什么大多数 RAID 控制器现在使用基于闪存的缓存而没有 BBU 的原因。
关于如何更换控制器(如果需要)。PERC5 确实将卷配置存储在磁盘本身上。当您更换控制器时,它只会将所有驱动器显示为"foreign"。在 RAID BIOS 中有一个菜单“Foreign Config”,允许您从驱动器导入配置。恕我直言,这个过程非常完美。