Um dos discos rígidos do meu Windows Server 2012 R2 começa a falhar e detectei isso tarde demais - somente quando não consegui ler um arquivo e recebi alguns erros estranhos na leitura.
Depois de verificar a unidade com uma ferramenta GUI, mostrou que tudo estava ok.
Então verifiquei com chkdsk
:
chkdsk d: /f /r
.................................
Stage 4: Looking for bad clusters in user file data ...
A disk read error occurredc0000010
The disk does not have enough space to replace bad clusters
detected in file 191666 of name \RECEIV~1\Langs\E141~1\New\202004~1.mp4.
235248 files processed.
File data verification completed
Portanto, concluo que o disco rígido estava realocando setores silenciosamente até que não houvesse mais setores sobressalentes.
Acho que é hora de alguma ferramenta de relatório SMART que seja executada em segundo plano no servidor. Qual você tomaria? Ou talvez existam alguns recursos internos no Windows Server 2012 R2?
Atualizar
Aqui estão as informações SMART da unidade
*** DiskCheckup V3.5 Build: 1002 Report ***
SysInfo DLL Version: SysInfo v2.3 Build: 1000
Time of export: 15:27:38 03-Nov-2022
Device information:
Device ID: 1
Interface: USB
Device Capacity: 3815445 MB
Serial Number: XXXXXXXXX
Model Number: TOSHIBA MQ04UBB400
Firmware Revision: JS000U
Partitions:
D: 3815317 MB
ATA information:
Disk geometry:
Cylinders: 486401
Tracks/Cylinder: 255
Sectors/Track: 63
Bytes/Sector: 512
Total disk sectors: 7814037168
Logical sector size: 512
Physical sector size: 4096
Media rotation rate: 5400 RPM
Buffer size: N/A
ECC size: N/A
Standards compliance:
ATA8-ACS Supported: Yes
ATA/ATAPI-7 Supported: Yes
ATA/ATAPI-6 Supported: Yes
ATA/ATAPI-5 Supported: Yes
ATA/ATAPI-4 Supported: Yes
SATA Compliance: Yes
SATA Gen3 Signaling Speed (6.0Gb/s) Supported: No
SATA Gen2 Signaling Speed (3.0Gb/s) supported: Yes
SATA Gen1 Signaling Speed (1.5Gb/s) supported: Yes
Transport Type: Serial
SATA 3.0 Transport Compilance: Yes
SATA 2.6 Transport Compilance: Yes
SATA 2.5 Transport Compilance: Yes
SATA II: Ext Transport Compilance: Yes
SATA 1.0a Transport Compilance: Yes
ATA8-AST Transport Compilance: Yes
World Wide ID: 0000000000000000
Feature support:
SMART supported: Yes
SMART enabled: Yes
SMART self-test supported: Yes
SMART error log supported: Yes
LBA supported: Yes
IORDY supported: Yes
CFast supported: No
DMA supported: Yes
Maximum Multiword DMA mode supported: 2
Multiword DMA selected: None
Maximum UltraDMA mode supported: 5
UltraDMA selected: 5
Maximum PIO mode supported: 4
SATA Compliance: Yes
NCQ priority information supported: No
Unload while NCQ commands are outstanding supported: Yes
Phy Event Counters supported: Yes
Receipt of power management requests supported: Yes
NCQ feature set supported: Yes
Software Settings Preservation: Supported, Enabled
In-order data delivery: Not supported
Initiating power management: Supported, Disabled
DMA Setup auto-activation: Supported, Disabled
Non-zero buffer offsets: Not supported
Trusted Computing supported: No
Host Protected Area (HPA) supported: Yes
Read look-ahead supported: Yes
Read look-ahead enabled: Yes
Write cache supported: Yes
Write cache enabled: Yes
Power management supported: Yes
Security mode supported: Yes
Security mode enabled: No
Device Configuration Overlay (DCO) supported: Yes
48bit Addressing supported: Yes
Auto Acoustic Managment (AAM) supported: No
Power-up in Standby (PUIS) supported: No
Advanced Power Management (APM) supported: Yes
Advanced Power Management (APM) enabled: Yes
Current APM level: Minimum power consumption without Standby
CompactFlash Association (CFA) supported: No
General Purpose Logging (GPL) supported: Yes
Streaming supported: No
Media card pass through supported: No
Extended power conditions supported: No
Extended status reporting supported: Yes
Extended status reporting enabled: No
Write-read-verify supported: Yes
Write-read-verify enabled: No
Free-fall control supported: No
TRIM command supported: No
SCT command transport supported: Yes
NV Cache enabled: No
NV Cache Power Management supported: No
SMART ATTRIBUTES:
ID Description Status Value Worst Threshold Raw Value TEC
---------------------------------------------------------------------------------------------------------------------------------------------
1 Raw Read Error Rate OK 100 100 50 0 N/A
2 Throughput Performance OK 100 100 50 0 N/A
3 Spin Up Time OK 100 100 1 5359 N/A
4 Start/Stop Count OK 100 100 0 7453 N/A
5 Reallocated Sector Count OK 100 100 50 0 N/A
7 Seek Error Rate OK 100 100 50 0 N/A
8 Seek Time Performance OK 100 100 50 0 N/A
9 Power On Time OK 71 71 0 11938 N/A
10 Spin Retry Count OK 249 100 30 0 N/A
12 Power Cycle Count OK 100 100 0 14 N/A
191 G-sense Error Rate OK 100 100 0 0 N/A
192 Power off Retract Count OK 100 100 0 1 N/A
193 Load Cycle Count OK 97 97 0 30040 N/A
194 Temperature OK 100 100 0 31 C N/A
196 Reallocation Event Count OK 100 100 0 0 N/A
197 Current Pending Sector Count OK 100 100 0 0 N/A
198 Uncorrectable Sector Count OK 100 100 0 0 N/A
199 UltraDMA CRC Error Count OK 200 253 0 0 N/A
220 Disk shift OK 100 100 0 0 N/A
222 Loaded hours OK 99 99 0 701 N/A
223 Load/Unload retry count OK 100 100 0 0 N/A
224 Load friction OK 100 100 0 0 N/A
226 Load-in Time OK 100 100 0 275 N/A
240 Head flying hours OK 100 100 1 0 N/A
Meu favorito pessoal é HD Sentinel. É mantido e suportado ativamente e é fácil para os recursos do sistema.
Isso pode ser verdade, mas eu vi exemplos de chkdsk lançando essa mensagem enquanto havia muitos setores de sobra. Duvido da precisão da mensagem de erro. Em primeiro lugar , as unidades realocam setores, não clusters . Clusters são apenas uma 'coisa' do ponto de vista do sistema de arquivos.
Mas realocações silenciosas são possíveis se a própria unidade detectar um problema com um setor enquanto ainda era capaz de recuperar os dados do setor. Portanto, IOW, uma unidade só será 'realocada silenciosamente' SE os dados de um setor forem recuperáveis após procedimentos de recuperação de erros (ERP) executados pela própria unidade.
No seu caso, o chkdsk relata que um setor está ruim, então isso significa que a unidade não conseguiu ler o setor. No SMART, você poderá ver um ou mais setores 'pendentes' (valor bruto > 0). Esses setores pendentes são realocados apenas na gravação. IOW se você escrever zeros no setor, isso sinaliza a unidade que você está disposto a desistir dos dados no setor defeituoso ou pendente.
Novamente, uma ferramenta como o HD Sentinel pode tentar isso: o scanner de superfície pode ser configurado para verificar erros de leitura e, em caso de erro, pode ser instruído a gravar zeros no setor problemático.
Mas, novamente, eu recomendo olhar primeiro para os valores gerais do SMART. E, em geral, aconselho a substituir uma unidade que começou a realocar setores e continua a fazê-lo.
Resumindo, em geral as condições para realocação do setor são:
Erros de gravação não recuperados
Quando uma operação de gravação não pode ser concluída após a execução completa do Error Recovery Procedure (ERP), os setores são realocados para o local sobressalente. Um erro é relatado ao sistema host somente quando o cache de gravação está desabilitado e a realocação automática falha.
Você pode observar que tal realocação de setor aconteceu usando um utilitário SMART, cada setor realocado incrementa o atributo 'contagem de setores realocados' em um (em valor RAW).
Nota: Se o número de setores sobressalentes disponíveis atingir um determinado limite (como 16 setores), a função de cache de gravação pode ser desabilitada automaticamente.
Erros de leitura não recuperados
Quando uma operação de leitura falha depois que um ERP (procedimento de recuperação de erros) definido é totalmente executado, um erro grave é relatado ao sistema host. Este local é registrado internamente como candidato à realocação.
Você pode observar tal evento usando um utilitário SMART, no atributo 'setores pendentes'.
Quando um local registrado é especificado como destino de uma operação de gravação, uma sequência de verificações de mídia é executada automaticamente. Quando o resultado dessa verificação atende aos critérios, esse setor é realocado.
Como resultado, se este evento, o valor SMART RAW de 'setores pendentes' diminui enquanto a 'contagem de setores realocados' aumenta.
Erros de leitura recuperados
Quando uma operação de leitura de um setor falha uma vez e é recuperada na etapa específica do ERP, esse setor de dados é realocado automaticamente. Uma sequência de verificação de mídia pode ser executada antes da realocação de acordo com as condições predefinidas.
Você pode observar que tal realocação de setor aconteceu usando um utilitário SMART, cada setor realocado incrementa o atributo 'contagem de setores realocados' em um (em valor RAW).