我的意思是,除了机架中的任何事件之外,像 hp msa1040 这样的冗余存储是否可能由于单点故障而死?
我问是因为我们要实现一个带有 2 个服务器和一个 san 的冗余 virt 系统(让我们将 msa1040 称为 san),但我对这个话题很陌生,我看不出为什么会有这样的 san( sas 附加)可能会死。
在这种系统中是否存在任何单点故障,或者正如所宣传的那样,它们中的一切都是多余的?
谢谢
编辑:对于downvoter,这仍然是一个愚蠢的问题,但我知道一切都会死。我想知道这些项目中是否真的存在非冗余组件。那么是的,即使是冗余组件也可能完全崩溃,但对我来说,这些不是单点,而是由给定冗余子系统的故障引起的整体系统故障。这是另一回事。
编辑 2:虽然我已将答案标记为已接受的答案,但我想指出,对我来说,绝对的最佳答案是: https ://mangolassi.it/topic/8822/why-dual-controllers -is-not-a-risk-mitigation-strategy-单独
是的,任何存储阵列都可能因某种原因停止工作。RAID 配置可能会失败(请参阅有关 RAID 级别的问题),背板可能会死机,等等......
确保有良好的备份和恢复计划。
通过恢复计划,我的意思是:如果您在示例中使用备份库并且它是使用它的 VM。即使您有良好的备份,请考虑带回阵列的时间 + 恢复 VM 并重新安装备份软件的时间 + 重新盘点磁带的时间 + 实际恢复的时间。如果在现实生活中没有计划这一步,就像我看到的 SAN 崩溃(阵列被烤了,它在 RAID50 中,遗憾的是同一组中的两个磁盘在短时间内死亡),它需要 3 天 24/7恢复。
所以对于你的实际问题,是的,它可能会失败(所以不要把你的鸡蛋都放在同一个篮子里)