我们有许多 HP DL385 G2 在安装 RHEL 5.3 后出现内核崩溃。所有都是最新的固件 CD 8.50。最初的 RHEL 5.3 安装始终有效,并且在大多数情况下第一次启动没问题(内核 2.6.18-128.el5);到目前为止,四分之一的人在这里感到恐慌。当“yum update”到内核 2.6.18-128.1.10.el5 时,我尝试过的大多数其他机器都无法启动。一两个还好。
恐慌总是在同一点上。控制台上记录的最后几行是:
device-mapper: uevent: version 1.0.3
device-mapper: ioctl: 4.11.5-ioctl (2007-12-12) initialised: [email protected]
usb 4-2: new full speed USB device using uhci_hcd and address 3
device-mapper: dm-raid45: initialized v0.2429
usb 4-2: configuration #1 chosen from 1 choice
hub 4-2:1.0: USB hub found
hub 4-2:1.0: 7 ports detected
然后暂停,然后:
kernel panic - not syncing - attempted to kill init
超过这一点,内核将不会启动(包括 Anaconda 安装的 2.6.18-128.el5),并且重新安装是唯一的选择。它似乎与HP 论坛上报告的这个问题非常相似。
那么,有什么想法吗?我们在 RHEL 5.2 上有 DL385 G2,因此 5.3 中的某些内容在相同的硬件上运行不佳。我们已经尝试过将 BIOS 恢复出厂设置等。我如何确定内核在做什么?(我已经从附加行中删除了“rhgb quiet”。)幸运的是,我们没有太多这些框,我有一点时间进行调查。
您是否尝试过更新 BIOS 和所有其他固件?
任何服务器的一个好的做法是禁用任何不需要的板载内容(这是 vmware 服务器的常用做法)。既然你的最后几行是关于 USB 的,那么关闭 USB 控制器怎么样?
编辑:删除了有关固件的讨论,首先没有看到您已经对其进行了修补
您是否使用 HP 为任何硬件提供的驱动程序?如果是这样,请尝试仅使用 vanilla 内核驱动程序。还可以尝试通过在 grub 中添加“nousb”和内核行的末尾来禁用 USB。
一位同事在 g5 迁移到 5u3 时看到了类似的问题。
看起来我们在 5u2 (8.15) 上使用的 PSP 版本与 5u3 不兼容。不过,我们并没有最终导致它无法启动。我们能够启动旧内核,将 PSP 升级到 8.20,然后再回到新内核。
然后我们当然发现了这个。
http://kbase.redhat.com/faq/docs/DOC-15564