我的 Windows Server 2012 R2 上的一个硬盘驱动器开始出现故障,我检测到这一点为时已晚 - 只有当我无法读取一个文件并在读取时遇到一些奇怪的错误时。
使用 GUI 工具检查驱动器后,它显示一切正常。
然后我检查了它chkdsk
:
chkdsk d: /f /r
.................................
Stage 4: Looking for bad clusters in user file data ...
A disk read error occurredc0000010
The disk does not have enough space to replace bad clusters
detected in file 191666 of name \RECEIV~1\Langs\E141~1\New\202004~1.mp4.
235248 files processed.
File data verification completed
因此,我得出结论,硬盘驱动器正在默默地重新定位扇区,直到没有更多的备用扇区。
我认为是时候使用一些在服务器后台运行的 SMART 报告工具了。你会拿哪个?或者也许在 Windows Server 2012 R2 中有一些内置功能?
更新
这是驱动器的 SMART 信息
*** DiskCheckup V3.5 Build: 1002 Report ***
SysInfo DLL Version: SysInfo v2.3 Build: 1000
Time of export: 15:27:38 03-Nov-2022
Device information:
Device ID: 1
Interface: USB
Device Capacity: 3815445 MB
Serial Number: XXXXXXXXX
Model Number: TOSHIBA MQ04UBB400
Firmware Revision: JS000U
Partitions:
D: 3815317 MB
ATA information:
Disk geometry:
Cylinders: 486401
Tracks/Cylinder: 255
Sectors/Track: 63
Bytes/Sector: 512
Total disk sectors: 7814037168
Logical sector size: 512
Physical sector size: 4096
Media rotation rate: 5400 RPM
Buffer size: N/A
ECC size: N/A
Standards compliance:
ATA8-ACS Supported: Yes
ATA/ATAPI-7 Supported: Yes
ATA/ATAPI-6 Supported: Yes
ATA/ATAPI-5 Supported: Yes
ATA/ATAPI-4 Supported: Yes
SATA Compliance: Yes
SATA Gen3 Signaling Speed (6.0Gb/s) Supported: No
SATA Gen2 Signaling Speed (3.0Gb/s) supported: Yes
SATA Gen1 Signaling Speed (1.5Gb/s) supported: Yes
Transport Type: Serial
SATA 3.0 Transport Compilance: Yes
SATA 2.6 Transport Compilance: Yes
SATA 2.5 Transport Compilance: Yes
SATA II: Ext Transport Compilance: Yes
SATA 1.0a Transport Compilance: Yes
ATA8-AST Transport Compilance: Yes
World Wide ID: 0000000000000000
Feature support:
SMART supported: Yes
SMART enabled: Yes
SMART self-test supported: Yes
SMART error log supported: Yes
LBA supported: Yes
IORDY supported: Yes
CFast supported: No
DMA supported: Yes
Maximum Multiword DMA mode supported: 2
Multiword DMA selected: None
Maximum UltraDMA mode supported: 5
UltraDMA selected: 5
Maximum PIO mode supported: 4
SATA Compliance: Yes
NCQ priority information supported: No
Unload while NCQ commands are outstanding supported: Yes
Phy Event Counters supported: Yes
Receipt of power management requests supported: Yes
NCQ feature set supported: Yes
Software Settings Preservation: Supported, Enabled
In-order data delivery: Not supported
Initiating power management: Supported, Disabled
DMA Setup auto-activation: Supported, Disabled
Non-zero buffer offsets: Not supported
Trusted Computing supported: No
Host Protected Area (HPA) supported: Yes
Read look-ahead supported: Yes
Read look-ahead enabled: Yes
Write cache supported: Yes
Write cache enabled: Yes
Power management supported: Yes
Security mode supported: Yes
Security mode enabled: No
Device Configuration Overlay (DCO) supported: Yes
48bit Addressing supported: Yes
Auto Acoustic Managment (AAM) supported: No
Power-up in Standby (PUIS) supported: No
Advanced Power Management (APM) supported: Yes
Advanced Power Management (APM) enabled: Yes
Current APM level: Minimum power consumption without Standby
CompactFlash Association (CFA) supported: No
General Purpose Logging (GPL) supported: Yes
Streaming supported: No
Media card pass through supported: No
Extended power conditions supported: No
Extended status reporting supported: Yes
Extended status reporting enabled: No
Write-read-verify supported: Yes
Write-read-verify enabled: No
Free-fall control supported: No
TRIM command supported: No
SCT command transport supported: Yes
NV Cache enabled: No
NV Cache Power Management supported: No
SMART ATTRIBUTES:
ID Description Status Value Worst Threshold Raw Value TEC
---------------------------------------------------------------------------------------------------------------------------------------------
1 Raw Read Error Rate OK 100 100 50 0 N/A
2 Throughput Performance OK 100 100 50 0 N/A
3 Spin Up Time OK 100 100 1 5359 N/A
4 Start/Stop Count OK 100 100 0 7453 N/A
5 Reallocated Sector Count OK 100 100 50 0 N/A
7 Seek Error Rate OK 100 100 50 0 N/A
8 Seek Time Performance OK 100 100 50 0 N/A
9 Power On Time OK 71 71 0 11938 N/A
10 Spin Retry Count OK 249 100 30 0 N/A
12 Power Cycle Count OK 100 100 0 14 N/A
191 G-sense Error Rate OK 100 100 0 0 N/A
192 Power off Retract Count OK 100 100 0 1 N/A
193 Load Cycle Count OK 97 97 0 30040 N/A
194 Temperature OK 100 100 0 31 C N/A
196 Reallocation Event Count OK 100 100 0 0 N/A
197 Current Pending Sector Count OK 100 100 0 0 N/A
198 Uncorrectable Sector Count OK 100 100 0 0 N/A
199 UltraDMA CRC Error Count OK 200 253 0 0 N/A
220 Disk shift OK 100 100 0 0 N/A
222 Loaded hours OK 99 99 0 701 N/A
223 Load/Unload retry count OK 100 100 0 0 N/A
224 Load friction OK 100 100 0 0 N/A
226 Load-in Time OK 100 100 0 275 N/A
240 Head flying hours OK 100 100 1 0 N/A
我个人最喜欢的是高清哨兵。它得到积极维护和支持,并且很容易占用系统资源。
可能是这样,但我已经看到 chkdsk 在有很多可用扇区时抛出此消息的示例。我怀疑错误信息的准确性。首先,驱动器重新分配扇区,而不是簇。从文件系统的角度来看,集群只是一个“东西”。
但是,如果驱动器本身检测到某个扇区有问题,而它仍然能够从该扇区恢复数据,则可以进行静默重新分配。因此,IOW,只有在驱动器本身执行的错误恢复程序 (ERP) 之后可以恢复扇区中的数据时,驱动器才会“静默重新分配”。
在您的情况下,chkdsk 报告一个扇区坏了,所以这意味着驱动器无法读取该扇区。在 SMART 中,您应该能够看到一个或多个“待定”扇区(原始值 > 0)。此类挂起的扇区仅在写入时重新分配。IOW 如果您将零写入扇区,这表明您愿意放弃坏扇区或待处理扇区中的数据的驱动器。
像 HD Sentinel 这样的工具可以再次尝试:表面扫描仪可以配置为扫描读取错误,并且可以指示错误时将零写入有问题的扇区。
但话又说回来,我建议首先查看整体 SMART 值。一般来说,我建议更换已经开始重新分配扇区并继续这样做的驱动器。
概括起来,一般来说,部门重新分配的条件是:
未恢复的写入错误
当错误恢复程序 (ERP) 完全执行后写入操作无法完成时,将扇区重新分配到备用位置。仅当禁用写缓存并且自动重新分配失败时,才会向主机系统报告错误。
您可以使用 SMART 实用程序观察到这样的扇区重新分配,每个重新分配的扇区将“重新分配的扇区计数”属性增加一个(以 RAW 值表示)。
注意:如果可用的备用扇区数达到一定的阈值(如 16 个扇区),可能会自动禁用写缓存功能。
未恢复的读取错误
如果在完全执行定义的 ERP(错误恢复过程)后读取操作失败,则会向主机系统报告硬错误。此位置在内部注册为重新分配的候选者。
您可以使用 SMART 实用程序在“待定扇区”属性中观察此类事件。
当注册位置被指定为写入操作的目标时,会自动执行一系列媒体验证。当该验证的结果符合标准时,重新分配该扇区。
因此,如果发生此事件,“待定扇区”的 SMART RAW 值会减少,而“重新分配的扇区计数”会增加。
恢复的读取错误
当一个扇区的读取操作失败一次,然后在特定的 ERP 步骤中恢复时,该扇区的数据将自动重新分配。根据预定义的条件,可以在重定位之前运行媒体验证序列。
您可以使用 SMART 实用程序观察到这样的扇区重新分配,每个重新分配的扇区将“重新分配的扇区计数”属性增加一个(以 RAW 值表示)。