有谁知道 MTBF(无故障平均时间)是否可用于确定计算机硬件(CPU 冷却器、电源、机箱风扇等)何时会发生故障,从而需要更换?或者它只是一个不可靠的统计数据,即使过去了 3 或 4 年也可以忽略?
我的机箱风扇和其他所有带风扇的东西都运行良好,已经使用了大约一年。在看到 MTBF 是什么后,我只是担心他们的预期寿命。
例如:我访问了供应商的网站,当我查看机箱中的机箱风扇时,它说 MTBF 大于 30,000 小时。这是否意味着它会持续 3 年以上,而在这 3 年或 4 年过去后,它们将失效,我将不得不更换它们?
此外,对于任何类型的硬件,更高的 MTBF 是否意味着更长的预期寿命?
关于 MTBF 对预测没有用的建议都是正确的。但它的用处甚至比那些意识到它无用的人倾向于认为的要小。
预期寿命
人生不同阶段有不同的失败
wrecclesham 的回答中的“浴缸曲线”的图形是一个概念图。实际上,两端的比例可能略有不同。例如,如果制造商使用优质零件和良好的制造质量控制,婴儿死亡率可能会非常低。
产品生命周期中不同阶段的故障主要是由不同种类的原因造成的。在婴儿死亡率期间,产品因有缺陷的零件或制造缺陷而失效。如果他们不及早失败,他们就会经历一段“消耗”期。每年都有一小部分单位因随机原因而失败。到使用寿命结束时,零件会磨损并发生故障,因为这就是组件的用途。
构建质量的巨大差异会在一定程度上影响所有阶段的失败。一个非常便宜的产品可能使用廉价的零件,制造精度差,并且通常很少关注质量控制。高端产品可能在所有方面都相反。
同一级别的产品在制造质量上可能没有太大差异。因此,例如,制造商可能会收到一批具有正常预期寿命但公差更宽的零部件。它可能有更高比例的婴儿死亡率,但如果它没有因为这个原因而失败,将具有相同的使用寿命。
旧零件的预期寿命
预期寿命实际上可能与您的想法相反。平均单位的预期寿命包括婴儿死亡率故障和随机损耗故障。旧设备不会因这些原因中的任何一种而发生故障。因此,仅包含旧设备的池将比包含所有新设备的池具有更长的平均总寿命。
设备持续时间越长,它越有可能因为其质量而持续那么久。它是为数不多的拥有最完美组件、以最高精度制造并得到最佳处理和保养的幸运装置之一。鉴于您有一个仍在工作的旧部件,预计它不会暂时失效,因为这是平均装置的持续时间。您的旧部件的预期寿命比普通部件更长(尽管这仍然无法告诉您特定部件的使用寿命有多长)。
平均无故障时间
这是什么
术语“MTBF”有多种用途。“平均无故障时间”用作可修复系统的预期系统正常运行时间或可用性的度量。“平均故障前时间”适用于可能可修复或不可修复的设备,但它通常与报废事件相关联。这就是这里的适用意义。
度量的名称“失败前的平均时间”非常具有误导性。通常情况并非如此。您可以通过运行一定数量的单元直到它们失效来衡量该定义,然后取这些时间的平均值。对于预期寿命为多年的物品,这是不切实际的;这些产品永远不会进入市场,因为它们将永远处于测试阶段。
这个数字是用另一种方式开发的。当不是简单地从类似模型的虚假数字中推断出来时,通常用于测量“MTBF”的方法是在相对较短的时间内测试大量单元。他们将总测试时间(测试持续时间 x 测试单元数)除以这段时间内的失败次数(并且他们通常不会在失败时按单元停止计时)。
它真正衡量的是什么
在此时间范围内发生的失败是婴儿死亡和他们生命早期的随机失败。他们永远不会遇到报废故障,而这正是您想知道的。只有一小部分装置在其生命早期出现故障。你不能从这些统计数据中推断或推导出生命终结的时间,它们实际上并没有告诉你关于预期寿命的任何信息。充其量,它们是将一个项目与另一个项目进行比较的粗略相对度量。
查看 MTBF 所基于的事件,磨损故障是任何产品都会发生的随机事件,与质量无关。质量高得多的产品将持续更长时间,因为零件需要更长的时间才能磨损,但在此之前的随机故障可能没有太大不同。
因此,MTBF 的差异往往主要反映了婴儿死亡率的差异,而不是生命终结的差异。如前所述,这可能反映出建筑质量的差异,这可能转化为预期寿命的一些差异。但这也可能是高质量设备的情况,制造商收到了一批质量不佳的组件。如果您的设备不是组件损坏的设备,它的预期寿命可能比普通设备长得多。
MTBF有没有实用价值?
如果您可以在两种产品之间做出选择,其中两种产品的 MTBF 估算方法相同(比如来自同一制造商的两种不同型号),并且一种产品的MTBF明显更好,这可能表明质量总体上更好,并且您可能希望它能持续更长的时间。在其他条件相同的情况下,更安全的选择是选择 MTBF 更好的产品。
如果 MTBF 数字接近,则微小差异只是统计噪声;它什么也没告诉你。
不,不幸的是不是。
组件的 MTBF(平均故障间隔时间)评级不能用于准确确定产品何时会发生故障,因为它只是衡量在故障发生之前可以使用的平均(即平均)时间。
MTBF 评级考虑了这样一个事实,即一些单独的组件将大大超过平均值,而其他组件可能会非常快地失效(也称为“婴儿死亡率”),将所有这些信息提炼成一个简单的平均值。
实际上,根据所讨论的产品类型,故障率可能相差很大: