Início do problema
Tenho um servidor dedicado no provedor de hospedagem e recentemente meu node exporter detectou alta saturação de io de disco no meu array RAID 1 /dev/md3. Eu verifiquei smartctl para meus discos rígidos e ambos os drives no meu array estavam mostrando alto número de erros de leitura:
[root@ovh-ds03 ~]# smartctl /dev/sda -a | grep Err
Error logging capability: (0x01) Error logging supported.
SCT Error Recovery Control supported.
1 Raw_Read_Error_Rate 0x000b 099 099 016 Pre-fail Always - 65538
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0
[root@ovh-ds03 ~]# smartctl /dev/sdb -a | grep Err
Error logging capability: (0x01) Error logging supported.
SCT Error Recovery Control supported.
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 65536
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0
Eu pedi por meio de um ticket de suporte para substituir 2 discos, mas em vez de substituir, mais 2 discos foram adicionados e o array foi reconstruído nesses 2 novos discos. Tudo estava bem, mas agora o array está em estado degradado e eu tive um alerta por causa disso chamado ️NodeRAIDDegraded
, verificando no servidor sim, ele está em estado degradado:
[root@ovh-ds03 ~]# mdadm --detail /dev/md3
/dev/md3:
Version : 1.2
Creation Time : Sat Mar 30 18:18:26 2024
Raid Level : raid1
Array Size : 1951283200 (1860.89 GiB 1998.11 GB)
Used Dev Size : 1951283200 (1860.89 GiB 1998.11 GB)
Raid Devices : 4
Total Devices : 2
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Sat Sep 14 19:30:44 2024
State : active, degraded
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Consistency Policy : bitmap
Name : md3
UUID : 939ad077:07c22e9e:ae62fbf9:4df58cf9
Events : 55337
Number Major Minor RaidDevice State
- 0 0 0 removed
- 0 0 1 removed
2 8 35 2 active sync /dev/sdc3
3 8 51 3 active sync /dev/sdd3
Como faço para consertar isso?
Eu tentei testar várias soluções para reconstruir a matriz do zero e assim por diante
mdadm --assemble --scan