今天我的 Storage Equallogic PS4000E 遇到问题,它们卡住了 45 分钟,然后正常启动并运行,没有日志,没有任何东西可以帮助我们发现发生了什么。
好吧,我运行带有 2 个服务器池版本的 Xenserver。5.6 SP2,在存储出现这个问题后,最近的 Linux vms Ubuntu 12 和 Windows Vms 恢复正常工作,但大多数旧的 Debian Vms,变成只读 FS,我们需要 fsck 全部,一些 vms 被永久损坏和其他重新启动和 fsck 后正常工作。
我想知道是否有任何方法可以防止 iScsi 上的 VM 文件系统损坏丢失连接/超时连接,可能会增加 Xen 上的 iScsi 超时或每个来宾 VM 中的类似情况。
有人吗?
当您处理大约 1 小时的存储连接丢失时,损坏不会完全可以预防 - 当然不是通过调整虚拟机管理程序或操作系统中的某些 SCSI 超时变量。
不幸的是,您无法更新保修,但对于 7.2k 磁盘 Equallogic 系统来说是正常的,最长保修期为 5 年(10K/15K/SSD 单元可以延长至 7 年)。我会链接到 EQL“发布和支持指南”PDF,但访问托管它的支持页面需要有效的保修。
您说只有您的“旧”Debian VM 之后会遇到严重的问题——这可能与他们使用的文件系统和/或您的挂载配置方式有关?(例如
data=journal
/ordered
/writeback
)这是极不可能的,尽管如果没有以前的经验/熟悉收集和分析它们,可能很难获得许多日志数据集。
你怎么知道这是一个存储问题?您观察到哪些事件/错误或行为导致了这一结论?
@Dom 在关于切换日志的评论中提出了一个很好的问题。Equallogic 诊断不是围绕最终用户的可读性构建的,但如果日志记录确实到位,则切换日志应该是完全可访问和可读的。
如果您没有预算在 SAN 使用寿命/可支持性结束后更换它,那么您一开始就买不起。我知道这完全是事后诸葛亮,对你没有帮助,但你应该认真考虑从 EQL 存储转移到更便宜的东西(比如多台服务器、仅本地存储,以及使用 DRBD 之类的复制 VM)。SAN 可能很棒,但它也是一项严肃的财务承诺。