我有一台运行 Arch x86_64 2.6.30 的机器。
它的 root 设置在一个自动挂载在 /dev/md0 下的 raid5 阵列上。
这是通过内核参数完成的,如下所示:
kernel /vmlinuz26 md=0,/dev/sda3,/dev/sdb3,/dev/sdc3 md=2,/dev/sda2,/dev/sdb2,/dev/sdc2 rootfstype=ext4 root=/dev/md0 ro
这曾经可以正常工作,但是有时,它会无法组装 md0 数组。
发生的情况是一切正常,内核探测块 ID,找到匹配项,然后等待阵列组装 10 秒。
这通常会立即完成,但有时它会等待 10 秒,之后它会超时并掉到我无法使用的故障恢复控制台,因为它不接受任何输入。我认为这可能是因为我唯一可用的键盘是 USB 键盘(即使键盘在 GRUB 菜单中工作)。
发生这种情况时,我只需要重新启动,阵列就会正常安装。
顺便说一句,这发生在大约 30% 的时间里。
它发生在干净关机后。
它可以连续发生不止一次。
由于无法挂载rootfs,因此无法写入任何日志。
有没有人见过这样的东西?
任何想法为什么会发生?
甚至没有错误的屏幕截图,我想没人能确定。您可以做的最好的事情是在您的系统中引入 initrd 并将您的引导过程转换为使用 UUID 而不是设备名称(这些名称可能会发生变化,例如,如果您将 pendrive 忘记在任何 USB 插槽中)。
当您正在搜索分区时,您可能需要检查它们是否都标记为 Linux Raid 自动检测分区(FD 型)而不是 Linux(83 型)。只要您不更改分区大小,您就可以使用您选择的分区编辑器安全地修改类型。如果你感觉特别偏执,一次只做一个分区,这样你就不会破坏整个团队。
您的内核足够现代,只要它具有适当的 mdadm 模块,无论是内置的还是在 initrd 中提供的,它都会扫描所有可用的分区。如果它找到一个 FD 类型的分区,它会检查一个 mdadm 超级块。具有相同raid id 的所有分区将自动重新组装,而无需在启动时显式设置。
你也可以继续定义它,但我会首先检查分区类型都是 FD,然后删除 raid 定义,看看它是否有帮助。
我假设它可能只是你的内核可能正在重新排序驱动器名称,因为它通常只是以先到先得的方式分配名称,而没有像 udev 这样的东西来进行重命名。
我的建议是使用 udev 附带的 initrd,这样您就可以确保驱动器的名称正确。如果您使用 udev(或类似的,定制的)然后只是通过 /dev/disk/by-uuid/ 安装驱动器,它会更加安全,因为它们通常不会改变。