Eu tenho um dispositivo Linux rodando em uma IBM X3850 X5 type 7143
caixa. CentOS 5.
Tem uma configuração RAID 5 com 6 unidades. 2 das unidades caíram. Um estava ruim e precisava ser substituído. O outro estava apenas offline e voltou online.
A matriz voltou a ficar online depois que a unidade offline voltou a funcionar e, nesse ponto, substituímos a outra unidade para que ela pudesse ser reconstruída. Neste ponto, todas as unidades estão aparecendo como estando online e a matriz RAID está mostrando um status íntegro no MegaRAID BIOS.
Dito isso, ainda recebo erros quando tento inicializar o CentOS. Especificamente, estou vendo:
Loading dm-message.ko module
Loading dm-raid45.ko module
device-mapper: dm-raid45: initialized v0.25941
Waiting for driver initialization.
Scanning and configuring dmraid supported devices
Creating root device.
Mounting root filesystem.
kjournald starting. Commit interval 5 seconds.
EXT3-fs: mounted filesystem with ordered data mod.
Setting up other filesystems.
Setting up new root fs
setuproot: moving /dev failed: No such file or directory
no fstab.sys, mounting internal defaults
setuproot: error mounting /proc: No such file or directory
setuproot: error mounting /sys: No such file or directory
Switching to new root and running init.
unmounting old /dev
unmounting old /proc
unmounting old /sys
ERROR opening /dev/console: No such file or directory
Trying to use fd 0 instead
WARNING: can't access (null)
exec of init ((null)) failed!!!: Bad address
Kernel panic - not syncing: Attempting to kill init!
Alguma ideia do que poderia estar acontecendo aqui e como solucionar o problema? Não sei por que o CentOS teria problemas se a matriz RAID fosse reconstruída com sucesso.
Seu ramdisk inicial está falhando no root pivot, porque você tem erros no sistema de arquivos em seu dispositivo root.
Sua matriz tem problemas de consistência devido ao fato de ter sido danificada em vez de apenas degradada em um ponto. Agora que você propagou essas inconsistências do sistema de arquivos por todo o array, sincronizando-o novamente (nada que você pudesse ter feito sobre isso, realmente), você precisará corrigi-los no nível do sistema de arquivos.
Faça um fsck offline em seu sistema de arquivos raiz e em qualquer outro sistema de arquivos que resida nessa matriz. Você pode ter que contar com um backup para restaurar sua máquina. Esta é uma das muitas razões pelas quais o RAID 10 vence o RAID 5 ou 6, e porque 5 e 6 estão tendo muito menos adoção do que costumavam. Dito isto, o RAID nunca é um backup e uma matriz danificada terá um sistema de arquivos danificado, independentemente do nível do RAID.
Portanto, a partição swap e as referências a ela em /etc/fstab precisam ser verificadas e corrigidas, se necessário. Pelo menos isso é óbvio a partir deste exemplo. Portanto, você não apenas precisa corrigir o espaço de troca, verificar /etc/fstab e corrigir quaisquer referências, se necessário, mas também recriar o arquivo initrd.
Há um exemplo neste link Centos5 Fix