我们使用 2 个 Windows Server 2019 Datacenter 节点设置了一个分布式故障转移集群,每个节点都运行 SQL Server 2019 Enterprise + SSMS18。
这两个节点位于具有两个不同 IP 子网的两个不同站点中。
每个主机都是一个 ESXI VM,只有一个 NIC(子网 A 中的主机 A,子网 B 中的主机 B)。
两个站点都通过 S2S-VPN 连接和路由之间的流量连接。
问题
我们仔细检查了每一个可能的问题,但我们无法通过 SSMS 手动故障转移具有同步数据库的可用性组
实例-> Always On 高可用性 -> 可用性组 -> -> 右键单击“故障转移”
- SQL Server 错误 41131(见附件)
故障排除
主机之间的连接已启动,“仪表板”显示两台主机正在通信、启动和同步。
Defender 防火墙规则适用于 DAG 侦听器、代理、浏览器服务。在站点 A 的 PaloAlto 防火墙上,可以检测到两个 SQL 主机之间的流量,但没有流量被拒绝。
两台主机都通过 SQL Server 代理和 SQL Server 引擎的单独服务用户运行,因此缺少
NT Authority\SYSTEM
.
AD-Clusterobject 的权限在那里,可以创建和更新任何子对象。创建后,侦听器的两个 DNS 条目和集群对象的一个 DNS 条目也在那里。
即使两台主机之间的自动播种工作正常,只有通过 SMSS18 的故障转移失败(插入的行从主机 A 复制到主机 B)。
问题
有什么想法,我们可以排除故障吗?
我附上了错误消息,但无法在线找到任何有用的信息,因为唯一连接的解决方案始终是更改 NT 帐户的权限,我们不将其用于代理或引擎。