我几乎在凌晨 1 点到凌晨 1 点 30 分之间失去了集群之间的通信,它在主节点上显示错误 35206,在集群上显示 976,有时由于心跳丢失导致 1135 错误、1069 错误,集群被删除。我有一种强烈的感觉,那时我的联系每天都会中断,但我不知道从哪里开始有点迷茫。任何帮助将不胜感激。
我几乎在凌晨 1 点到凌晨 1 点 30 分之间失去了集群之间的通信,它在主节点上显示错误 35206,在集群上显示 976,有时由于心跳丢失导致 1135 错误、1069 错误,集群被删除。我有一种强烈的感觉,那时我的联系每天都会中断,但我不知道从哪里开始有点迷茫。任何帮助将不胜感激。
你检查过 SQL 错误日志吗?从错误的描述开始。是因为它失去了法定人数吗?任何节点中是否有高 CPU?你在 FCI 还是 AAG?
当数据库在高峰值 ETL 负载期间报告不健康时,我们必须调整副本之间的超时。
0 反对票设置跟踪以调查服务器上正在运行的其他内容。然后检查 SQL 等待统计信息。https://www.sqlskills.com/blogs/paul/wait-statistics-or-please-tell-me-where-it-hurts/
如果没有负载 - 将超时增加到更高的值(https://blogs.msdn.microsoft.com/alwaysonpro/2014/06/03/connection-timeouts-in-multi-subnet-availability-group/))看看错误是否消失了。但是,如果您的工作量没有问题,那么您不应该担心这些错误。首先,您需要评估用户是否抱怨速度慢,在此期间是否有任何作业失败?在尝试简单地解决错误之前,您必须问这些问题。