我有一个在服务器上运行的 LSI MegaRAID 9260-16i 卡,它一直在记录错误
Controller ID: 0 Transient error detected while communicating with PD: -:-:1
我在任何地方(文档、谷歌、论坛等)都找不到关于此消息的任何信息。这条消息是什么意思?
我有一个在服务器上运行的 LSI MegaRAID 9260-16i 卡,它一直在记录错误
Controller ID: 0 Transient error detected while communicating with PD: -:-:1
我在任何地方(文档、谷歌、论坛等)都找不到关于此消息的任何信息。这条消息是什么意思?
显然这个错误是由于使用的磁盘类型造成的。LSI 回复我的支持票如下:
我不知道这是一个问题,但在进行了更多测试之后,我相信这确实是问题的根源。我已经更换了背板和 SAS 电缆但没有成功,并且我已经对操作系统虚拟磁盘(使用企业戴尔磁盘)和数据磁盘(使用桌面三星磁盘)进行了“压力”测试,并且仅在运行“在 DATA 磁盘上进行压力”测试时,我是否收到了这些错误。
因此,我认为除了实际购买企业级磁盘(例如 LSI 支持的“Western Digital® RE Enterprise 2TB”)之外别无其他解决此问题的方法。尝试重用硬件就这么多了。
更新(2013 年 3 月 11 日)
控制器运行 2 个阵列,一个使用 WD 企业磁盘的 RAID1 和一个使用三星台式机磁盘的 RAID6。这个周末 RAID1 阵列降级了。日志中充斥着我原始帖子中提供的错误消息。奇怪的是RAID1阵列使用的是企业级磁盘。难道真的是另一个阵列上的其中一个 SAMSUNG 磁盘有问题,然后其中一个 WD 磁盘在另一个阵列上被驱逐了吗?这对我来说似乎是一种奇怪的行为。
更新(2015 年 5 月 29 日)
自从我处理这个问题以来已经有一段时间了。我相信实际原因与电源有关。我将所有 4 个背板连接到同一个电源连接器(使用分离器)。在峰值(功耗)时,由于无法提供足够的功率,磁盘会“掉线”。我通过简单地将两个电源连接器分别拆分到两个背板上来解决这个问题。