在 SQL Server 实例之一中,我无法执行任何查询。我认为这是由于负载过重所以我尝试执行sp_execeute whoisactive
并得到:
]
昨晚,DBA 已升级到 SQL Server 2022 CU5,并告诉我有一个问题,已通过 CU7 解决。因此,升级到 CU7,但没有任何变化。
DBA 发给我这个:
之后:
但我不确定发生了什么事。DBA 停止了查询存储和所有扩展事件会话,但没有任何变化。现在,DBA 认为问题是由此引起的,但它应该在 CU4 中修复,并且它会在升级过程中(而不是升级后)引起问题。
DBA已向MS开票,但我想知道是否有人知道可能导致此问题的原因是什么?
我将附上跟踪数据。更多信息 - 我们有 SQL Server 2022 CU5 实例和另一个运行 CU7 副本的实例。
另一位 DBA 认为问题出在始终在线的副本上,因此它们被停止 - 副本不断崩溃。
根据上传的日志,错误日志的第一个问题为 Dump0062(这与它本身有关),此后发生的任何事情都怀疑是实际问题,因为它可能是此问题的副作用,使 SQL Server 陷入困境。不一致的状态。
话虽如此,最初的问题似乎与 UCS 相关:
这恰好是
EXCEPTION_ACCESS_VIOLATION
一种 AV。这会导致 SQL Server 关闭 (SQL Server is terminating this process.
),因此此后的任何事情都无需调查。根据日志(以及从中感知到的配置和设置),错误最可能的原因是竞争条件或对数据结构的非线程安全访问。如果这种情况仅发生在单个服务器上(并且所有其他服务器都已修补),那么运行内存检查可能是有意义的(只是为了安全起见)。如果所有服务器上都发生这种情况,则很可能是产品问题。
如果这种情况在下层补丁上没有发生,那么卸载已安装的 CU 并查看它是否会再次发生可能是有意义的。