我在 dba 堆栈交换中环顾四周,但无法找到这个问题的答案,所以这就是我关心的问题。希望有人对此做过一些研究并可以提供权威的答案。
我们有一个在 2 个节点上运行的 Active/Active SQL Server 集群。SQLA 是一个实例的默认节点,另一个实例 (SQLB) 作为故障转移,反之亦然(另一个实例的 SQLB 默认节点,SQLA 作为故障转移)。这些服务器在具有 64GB RAM 的物理盒子上运行
我们必须配置“最大服务器内存”,这里有两种理论
- 第一个理论:遵循Jonathan Kehayia 几乎普遍接受的方法,简而言之,就像这样“为操作系统预留 1 GB RAM,从 4–16 GB 安装的每 4 GB RAM 预留 1 GB,然后 1 GB 用于每 8 GB RAM 安装在 16 GB RAM 以上。” 这将使每个框的最大服务器内存设置为 53 GB
- 第二种理论:我们需要将Max Server Memory的上限设置为一个值,以便在发生故障转移时允许辅助节点处理另一个实例。这将每个实例限制为更小的值(大约 30 GB,因此操作系统有 30 GB x 2 + 4GB = 64GB)
乍一看,第一种理论是可取的,因为它为每个实例提供了更大的内存空间,但有些人(包括我)不确定如果故障转移会发生什么,然后在同一个盒子上有 2 个实例,每个最大服务器内存为 53 GB RAM。
您知道处理这种情况的方法是什么吗?这两种方法中的任何一种都正确吗?还是您有正当理由应该改用第三种方法?你知道有什么严肃的博客文章或白皮书可以用证据来支持它吗?
谢谢你们!
请注意,这实际上称为多实例集群不活跃。您对两个节点都在同一节点上时会发生什么的担忧是正确的,在这种情况下,您需要一个动态脚本来识别故障转移并相应地调整 SQL Server 最大服务器内存。
让我们关注当两个节点都在各自的节点上运行时如何正确设置最大服务器内存,请参阅我在 SE 线程上的回答What is Sensible way to calculate max server memory。
现在针对发生故障转移并且两个实例都在同一节点上的场景。您必须使用来自以下资源的脚本。
通过启动代理作业使用 PowerShell 脚本来平衡故障转移集群上两个实例之间的内存
一个类似的线程谈论如何为多实例集群调整内存
现在,当两个实例都在同一个节点上时,您将不得不平均分配内存,为操作系统留出足够的内存。在那种情况下,每个实例 29 G,操作系统 6 G 是我认为很有价值的。因为您有 2 个实例正在运行,所以为操作系统留下更多的演出实际上会有所帮助。
另请注意,您应该立即摆脱这种情况,因为这两个 SQL Server 都会非常慢。