从 2003 年迁移到 2008 年 Microsoft 群集技术

Question

Paul Randal

Asked: 2009-06-17 18:59:54 +0800 CST2009-06-17 18:59:54 +0800 CST 2009-06-17 18:59:54 +0800 CST

结合故障转移集群和数据库镜像

在 SQL Server 中组合故障转移群集和数据库镜像时，您需要更改镜像伙伴超时值，以便本地群集在数据库镜像故障转移之前有机会进行故障转移。我很好奇人们在结合这些技术时在做什么——我教授各种 HA 课程，这种组合并不太常见。

如果您结合使用故障转移群集和数据库镜像，这是我的问题。如果您可以在每个回复中全部回答，那对我来说将非常有用。我不需要解释为什么需要改变事情或技术如何工作 - 我曾经在微软拥有它们 - 我对行业实践感兴趣，现在将它们结合起来的可能性已经存在 4 年了.

1) 集群 SQL Server 实例为您进行故障转移平均需要多长时间？（我知道这取决于需要多少崩溃恢复，但你的平均水平是多少？）

2) 对于这些相同的实例，您将镜像伙伴超时设置为多少？

3) 您是否对可能发生真正的集群中断这一事实感到满意，并且可能需要相当长的时间才能镜像注意到发生故障，因为您已经将镜像伙伴超时时间延长了？

感谢所有回复！

mrdenny · Answer 1 · 2009-06-17T19:08:25+08:00

mrdenny

Paul, 1. 通常是几秒钟，最多几分钟，具体取决于......（你知道其余的）。

如果我要设置自动故障转移，我会花几分钟。这样，站点到站点的 VPN 连接将有时间恢复，集群可以重新启动，等等。在发生本地事件时，我可能会比集群节点重新启动所需的时间长 4 分钟。停电。
是的。DR 问题通常定义为一个多小时的故障。此外，全局负载均衡器可能需要更长的时间才能注意到另一个站点已关闭，并上传所有 DNS，加上 DNS 上的 TTL 时间。该总时间应该是自动故障转移时间量的上限。

Nick Kavadias · Answer 2 · 2009-06-19T09:54:11+08:00

Nick Kavadias

我没有参与原始设计，但这就是设置的方式：

每个站点上的 2 个节点集群，运行主动/主动
该应用程序总共使用 5 个数据库，4 个在一个实例上运行。另一个 db 1 自行运行（负载更高）
这些站点通过暗光纤连接
每个站点都有相同数量的使用镜像感知客户端的 Web 服务器
为所有 5 个数据库设置了数据库镜像
每个站点都有另一台独立服务器可以充当见证人。见证人当前在所有主体所在的站点上运行。
1. 我从未见过发生集群故障转移。镜像故障转移很快，我会说最多大约 10 秒。
2. 所有数据库的合作伙伴超时时间为 30 秒
3. 镜像故障转移将在群集故障转移之前发生是设计使然。尽管每个实例都配置为仅使用服务器上可用 RAM 的一半，但 db 仅作为额外级别的冗余进行集群。