我有一个托管 3 个 SQL Server 实例的 2 节点 SQL Server Always On 集群,配置如下:
- 每个节点的服务器总内存为 768G。
- 内存消耗为 98%。
- LPIM 被激活。
- 实例“A”最小服务器内存为 102G,最大 512G。
- 实例“B”最小服务器内存为 102G,最大 490G。
最近,我安装了一个新实例“C”,最小和最大服务器内存设置为 8G。
似乎“C”在可用内存方面存在很多问题。启动时:
有时连接或 AG 失败并显示以下消息:
“资源池‘内部’中的系统内存不足,无法运行此查询”
参考文档有几个相关的原因。
我的第一个猜测是实例“A”和“B”仍在获取所有可用内存,当新实例启动时,操作系统会回收其中的一部分。
我的第二个猜测是服务器上没有更多内存用于这个新实例,所以大部分都被发送到页面文件。
我想听听你对这个问题的看法。
我在这里看到的唯一解决方案是为每个实例正确重新配置最大服务器内存,并为操作系统留出一些可用空间。
我试图停止实例“B”,释放大量内存,然后重新启动我新安装的实例。操作系统上有很多可用内存,但错误仍在发生。
我注意到的另一点是 SOSMEMMANAGER 店员抓住了所有的记忆。
实例 A 和 B 会在系统内存压力时释放内存,但不是瞬时的。因此实例 C 可能无法在需要时分配内存。所以,是的,这里的典型解决方案是减少每个实例的最大服务器内存,以便其他实例始终有足够的功能来最低限度地运行。
此外,您还应该在实例 C 上设置 LPIM,这样它的内存就不会被调出。这不是灵丹妙药,但对于 SQL Server 来说,不能分配额外的内存比将其已经分配的内存换出要好。
您正在服务器上过度分配内存,A&B 实例最大内存总共为 1002GB。
您没有说明服务器有多少 CPU,但如果您有 8 个内核,那么您应该分配的最大内存总量应该在 669.500MB 左右,如果您有更多内核,则更少。由于集群服务和 AlwaysOn 有一些额外的开销,我会降低总分配量
因此,如果实例 C 使用 8GB 内存,您还有 661.308MB 可用,如果我们保持实例之间的比率相同,实例 B 为 317.427MB,实例 A 为 343.881MB。