在 mdadm softraid 6(大约 12 个磁盘,60TB)上,大文件(>100GB)中出现了意外的错误写入。检查了所有系统 - RAM、NIC、LSI RAID 卡。最怀疑的是 LSI,因为它的电池 BBU 是扁平的,并且没有正确设置回写/直写。理论上,每个数据块都使用 XOR 冗余备份,RAID5 1x,RAID 6 2x。但这仅在某些活动磁盘发生故障时才起作用。
在 mdadm 中是否有一个命令可以在考虑 XOR 备份的情况下启动完整的数据一致性检查?这意味着我可以识别错写的块吗?
在我丢弃BBU之后我想知道,哪些文件是好的,哪些文件已损坏,必须更换。如果没有办法解决它,我应该从头开始创建数组并从他们的备份中获取所有文件。