有许多不同的存储介质。仅举几例:
- DVD
- 光盘
- 普通硬盘
- SSD硬盘
- USB 闪存棒
假设我已将一些文件保存到某个媒体。我将如何计算媒体/设备在 X 时间单位内损坏并且我将无法访问内容的概率?
是否有任何好的资源可以为不同的设备和媒体类型提供此类统计数据和公式?
如果可能的话,我想要数字和公式。使用“使用儿子、父亲和祖父类型的备份方案,其中祖父被复制并存储在两个不同的安全位置”可能确实是个好建议。但我希望能够根据一些真实世界的统计数据计算设备/媒体发生故障的概率。
有许多不同的存储介质。仅举几例:
假设我已将一些文件保存到某个媒体。我将如何计算媒体/设备在 X 时间单位内损坏并且我将无法访问内容的概率?
是否有任何好的资源可以为不同的设备和媒体类型提供此类统计数据和公式?
如果可能的话,我想要数字和公式。使用“使用儿子、父亲和祖父类型的备份方案,其中祖父被复制并存储在两个不同的安全位置”可能确实是个好建议。但我希望能够根据一些真实世界的统计数据计算设备/媒体发生故障的概率。
让我们从硬盘开始。有三项很好的研究提供了足够多有趣的真实世界统计数据: 卡内基梅隆大学、谷歌和Netapp。具有某种意义的统计数据是年度故障率 (AFR),即驱动器在给定年份内发生故障的频率。这些研究表明,一个不足为奇的结果是,制造商规格(如平均故障前时间)大大低估了一年内磁盘故障的可能性。这些数字因条件而异,我从中提取的经验法则是,在具有良好设备的最佳条件下,您可能会达到 2% 的 AFR,但您应该期望最坏情况下的 AFR 接近 10%。
如果您有两台设备具有相同数据的副本,并且它们的故障几率在统计上是独立的,那么您只需将百分比相乘即可得出两者都发生故障的机会。例如,假设两个硬盘驱动器的故障率为 5%(合理的中间值),那么在给定的一年内您将同时丢失这两个硬盘的几率为 5% * 5% = 0.25%。现在,如果两个驱动器都在同一个系统中,那么两个驱动器发生故障的几率要高得多——它们远非独立——所以这里的实际几率在 5% 到 0.25% 之间;如果不深入了解控制器和电源故障等统计数据,就不可能比这更接近。有关更多示例和背景信息,请参阅此处的标准 RAID 级别。
回到你最初的问题,其他类型的媒体呢?尽管MTBF率已被证明是硬盘驱动器的一个非常乐观的值,但对于许多其他媒体类型,这是您将找到的最佳评级。您可以使用在线可靠性计算器组合多个设备的 MTBF 或其近亲 MTTF 。您可能能够找到一些您正在考虑的其他媒体类型的真实世界研究,以帮助您找到更真实的 MTBF 数据,而不是使用制造商的数字。