história de fundo.. tirei meus 2 drives seagate 32000641AS de um antigo conjunto de discos dns-323.. coloquei-os no meu dell Precision T5600, pois o dns-323 era antigo e estava se tornando um problema para gerenciar. então criei dois fs XFS separados neles e os montei. Os discos com os quais substituí esses eram drives menores de 500G.. copiei os dados deles para um pendrive criptografado usb de 300G. depois que coloquei os seagates, copiei os dados de volta.. uso um para backup local e o outro para executar uma VM virtualbox, mas ambos os drives tinham os mesmos dados do usb.
Notei isso hoje no syslog de ambas as unidades.
smartd[809]: Device: /dev/sda [SAT], 19 Currently unreadable (pending) sectors
smartd[809]: Device: /dev/sda [SAT], 19 Offline uncorrectable sectors
smartd[809]: Device: /dev/sda [SAT], 19 Currently unreadable (pending) sectors
smartd[809]: Device: /dev/sda [SAT], 19 Offline uncorrectable sectors
no entanto, não houve problemas de desempenho. Além disso, quando eu estava copiando os dados de volta da unidade USB, 1 DIR não copiava de volta... ele continuava me dando um erro de E/S... eu não precisava disso, então simplesmente não copiei de volta.
é por isso que estou recebendo exatamente os mesmos erros em ambas as unidades? ou é coincidência?
então eu fiz mkfs.ext4 em /dev/sdb1
e agora estou correndo
badblocks -s -v -n -f /dev/sda
Checking for bad blocks in non-destructive read-write mode
From block 0 to 1953514583
Checking for bad blocks (non-destructive read-write test)
Testing with random pattern: 1.43% done, 36:36 elapsed. (0/0/0 errors)
e até agora nenhum erro com badblocks, mas então recebi isso no syslog
smartd[809]: Device: /dev/sda [SAT], 19 Currently unreadable (pending) sectors
smartd[809]: Device: /dev/sda [SAT], 19 Offline uncorrectable sectors
smartd[809]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 116 to 117
smartd[809]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 68 to 67
smartd[809]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 32 to 33
smartd[809]: Device: /dev/sdb [SAT], 35 Currently unreadable (pending) sectors
smartd[809]: Device: /dev/sdb [SAT], 35 Offline uncorrectable sectors
smartd[809]: Device: /dev/sdb [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 116 to 113
smartd[809]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 35 to 49
Sim!
Os dados SMART são produzidos pelo próprio firmware do disco rígido; não é realmente possível obter falsos positivos lá. Se os dados inteligentes estiverem dizendo que você tem blocos defeituosos em ambas as unidades, então você tem blocos defeituosos. Alguns pequenos pedaços da ferrugem giratória estragaram e não há como consertá-los. Este é um processo lento; aconteceu enquanto eles estavam envelhecendo em sua casa anterior. O fato de os números serem idênticos no início é interessante, mas não realmente chocante; as unidades teriam vindo do mesmo lote de fabricação e, portanto, teriam propriedades muito semelhantes. Se quiser ter certeza, você pode tentar procurar atualizações de firmware; é possível que um firmware defeituoso faça com que o dispositivo detecte erros falsamente. No entanto, a explicação provável é simples; blocos defeituosos em ambos.
Agora, não é o fim do mundo; você perdeu alguns dados (na unidade), e as unidades provavelmente perderão mais, ou falharão completamente. Mas você pode continuar usando-as, desde que os dados também estejam indo para outra unidade provavelmente boa. Dependendo da sua configuração RAID, ela deve manter as duas cópias sempre que um bloco apresentar problemas. Não faça RAID das duas unidades antigas em uma, pois quando elas falharem, elas irão juntas. E execute
xfs_scrub
(ou qualquer que seja seu sistema de arquivos preferido) sobre os dados RAID de forma rotineira, para detectar mais blocos ruins.Primeiro, seus dados de:
Não parece com nenhuma das suas duas unidades Seagate 32000641AS, mas sim com sua unidade de inicialização SDA. Em ambos os casos, como são unidades Seagate 2G, elas devem ser formatadas em GPT, não em formatos MBR.
A respeito de:
Se você observar,
man badblocks
verá que badblocks indica que não deve ser executado diretamente...A maneira correta de bloquear um disco é:
sudo e2fsck -fccky /dev/sdXX
# onde sdXX é a unidade que você deseja testarO -k é importante, porque ele salva a tabela de bad block anterior e adiciona quaisquer bad blocks novos a essa tabela. Sem -k, você perde todas as informações de bad block anteriores.
O parâmetro -fccky...