我需要有关如何为具有 16 个磁盘阵列的服务器设置 RAID 的建议(引导/操作系统磁盘在此阵列之外)。在这个 16 磁盘阵列中,所有磁盘都是相同的(12.8TB SSD)。
对我来说,理想的解决方案是至少有一半的可用空间(因此,204.8TB 中至少有 102.4TB),以及抵抗至少 8 个磁盘故障的能力(任何 8 个磁盘都应该能够在没有任何数据的情况下发生故障失利)。
无需将 102.4TB 可用空间视为单个连续卷,因此也可以将磁盘分组为单独的 RAID 卷等,只要任意 8 个磁盘可以中断而不会丢失任何数据。
我正在考虑几个解决方案,但没有一个解决方案真正让我完全满意:
第一个解决方案是具有 8 个跨度的单个 RAID 1+6 卷(76.8TB 容量,在最坏的情况下,任何 5 个磁盘都可以中断而不会丢失数据)。方案:
RAID6( RAID1(D1,D2), RAID1(D3,D4), RAID1(D5,D6), RAID1(D7,D8), RAID1(D9,D10), RAID1(D11,D12), RAID1(D13,D14), RAID1(D15,D16) )
第二种解决方案是具有 2 个跨度的单个 RAID Z3+1 卷(容量为 64TB,在最坏的情况下,任何 7 个磁盘都可以中断而不会丢失数据)。方案:
RAID1( RAID_Z3(D1,D2,D3,D4,D5,D6,D7,D8), RAID_Z3(D9,D10,D11,D12,D13,D14,D15,D16) )
对我来说,完美的 RAID 解决方案是八位奇偶校验 RAID(如 RAID 5 是单奇偶校验,RAID 6 是双奇偶校验,RAID Z3 是三重奇偶校验),因为这意味着 102.4TB 的可用空间和任何 8 个磁盘都可以在没有的情况下损坏数据丢失。但不幸的是,这个假设的“RAID Z8”并不存在。
提前感谢您的任何建议。
PS:在这种情况下,性能确实不是问题,因此不是要考虑的参数。
PPS:我寻求抵抗任何 8 磁盘故障的原因是因为这些磁盘将包含高度关键的任务数据。备份已经计划好了,但如果 RAID 卷停止工作,依赖它的几个关键任务服务器和服务也将停止工作。
PPPS:服务器本身的高可用性已经得到照顾。