Sou novo no LVM e ainda não sei qual é a melhor prática para remover um disco/PV com falha? Por exemplo: eu tenho uma piscina fina my_volume_group/my_lv
. Eu removo um disco (/dev/sde) do controlador RAID e o lvm dá este aviso:
WARNING: Couldn't find device with uuid QHOWyk-Ofjr-jnqU-iF7i-YqSJ-BeI4-UpqeI7.
WARNING: VG my_volume_group is missing PV QHOWyk-Ofjr-jnqU-iF7i-YqSJ-BeI4-UpqeI7 (last written to [unknown]).
Tentei:
vgreduce --removemissing --force my_volume_group
Logical volume my_volume_group/res0_00000 is used by another device.
Então eu removo este recurso res0 neste nó e tento novamente:
vgreduce --removemissing --force my_volume_group
Cannot activate my_volume_group/my_lv_tdata: pool incomplete.
Failed to suspend my_volume_group/my_lv with queued messages.
Failed to update pool my_volume_group/my_lv.
Agora não tenho ideia de como sair dessa situação.
Aparentemente
/dev/sde
ainda continha pelo menos um pedaço demy_volume_group/my_lv_tdata
, que é um componente essencial do volume lógico do thin-poolmy_volume_group/my_lv
. Você pode conectar o disco exatamente como estava?Então, se funcionar e
vgchange -ay my_volume_group
for bem-sucedido, use apvmove /dev/sde
para tentar mover quaisquer dados restantessde
para outros PVs demy_volume_group
. Se for bem-sucedido, napvs
saída, os campos PSize e PFree/dev/sde
deverão ser iguais, indicando que nenhuma parte dele está mais em uso; só então você poderá começar a remover/dev/sde
sem perda de dados.Você mencionou que tem um controlador RAID. Não vejo nenhuma evidência de qualquer configuração RAID aqui: se
/dev/sde
fosse apenas um único disco físico, então os recursos RAID do controlador pareciam não ser utilizados e não havia proteção contra a falha de um único disco. Então, onde deveria estar o RAID?Ou talvez
/dev/sde
originalmente fosse um conjunto RAID 1 ou RAID 5, mas já tinha um disco com falha antes, então não poderia suportar mais falhas. Se a primeira falha passou despercebida, então você não tem monitoramento da integridade do RAID: você realmente precisa dele, porque sem ele, a falha do primeiro disco em cada conjunto RAID pode não apresentar nenhum sintoma detectável.Se o disco que estava
/dev/sde
agora estiver completamente morto, seu grupo de volumes agora terá uma lacuna de dados perdidos no thin-pool LVmy_lv
. Se você tiver um bom backup dele, excluirmy_lv
, recriá-lo e restaurar seus dados do backup é provavelmente a maneira mais rápida e fácil de proceder.Os recursos de armazenamento do Linux podem ser empilhados uns sobre os outros em ordem arbitrária: esse é um recurso poderoso, mas pode ser confuso no início. Lembre-se de que você deve começar do fundo da pilha e construir uma camada de cada vez ao configurar coisas novas, e começar no topo e derrubar uma camada de cada vez ao remover coisas.
(Se você retirar uma camada do meio da pilha, as camadas superiores agora não suportadas geralmente desaparecerão se não estiverem montadas ou em uso , mas você deve estar familiarizado com a configuração de armazenamento antes de usar este atalho. Se a camada que agora está no topo do nada estiver realmente em uso, o kernel ficará muito infeliz.)