在 SQL Server 中组合故障转移群集和数据库镜像时,您需要更改镜像伙伴超时值,以便本地群集在数据库镜像故障转移之前有机会进行故障转移。我很好奇人们在结合这些技术时在做什么——我教授各种 HA 课程,这种组合并不太常见。
如果您结合使用故障转移群集和数据库镜像,这是我的问题。如果您可以在每个回复中全部回答,那对我来说将非常有用。我不需要解释为什么需要改变事情或技术如何工作 - 我曾经在微软拥有它们 - 我对行业实践感兴趣,现在将它们结合起来的可能性已经存在 4 年了.
1) 集群 SQL Server 实例为您进行故障转移平均需要多长时间?(我知道这取决于需要多少崩溃恢复,但你的平均水平是多少?)
2) 对于这些相同的实例,您将镜像伙伴超时设置为多少?
3) 您是否对可能发生真正的集群中断这一事实感到满意,并且可能需要相当长的时间才能镜像注意到发生故障,因为您已经将镜像伙伴超时时间延长了?
感谢所有回复!
Paul, 1. 通常是几秒钟,最多几分钟,具体取决于......(你知道其余的)。
如果我要设置自动故障转移,我会花几分钟。这样,站点到站点的 VPN 连接将有时间恢复,集群可以重新启动,等等。在发生本地事件时,我可能会比集群节点重新启动所需的时间长 4 分钟。停电。
是的。DR 问题通常定义为一个多小时的故障。此外,全局负载均衡器可能需要更长的时间才能注意到另一个站点已关闭,并上传所有 DNS,加上 DNS 上的 TTL 时间。该总时间应该是自动故障转移时间量的上限。
我没有参与原始设计,但这就是设置的方式:
每个站点都有另一台独立服务器可以充当见证人。见证人当前在所有主体所在的站点上运行。
我从未见过发生集群故障转移。镜像故障转移很快,我会说最多大约 10 秒。
所有数据库的合作伙伴超时时间为 30 秒
镜像故障转移将在群集故障转移之前发生是设计使然。尽管每个实例都配置为仅使用服务器上可用 RAM 的一半,但 db 仅作为额外级别的冗余进行集群。