我遇到了与自动故障转移相关的异常行为,因此在关闭 SQL Server 服务的情况下自动故障转移不起作用。集群磁盘似乎仍连接到故障节点,但我无法找出导致此行为的最终问题。如果您能帮助我理解这个问题,我将非常感谢您。
出于测试目的,我在域控制器上创建了 iSCSI 目标,并连接了 2 个启动器:
以下是有关我的集群的详细信息:
以下是有关我的 SQL Server 服务的详细信息:
以下是有关集群磁盘的详细信息(我只添加了其中一个磁盘的详细信息,因为两个磁盘相同):
现在,当我关闭 SQL Server 服务时,服务的自动故障转移不会发生:
I tested other scenarios where automatic failover successfully works:
- Manual failover
- Shutting down active node
- Disabling adapter on active node
- killing sql server process in task manager
- killing sql agent service process in task manager
In all above scenarios, resources successfully failed over to another node.
Could you please help me to figure out what is going wrong with automatic failover when I shutdown SQL Server service on active node?
The Failover Cluster Manager is THE tool for managing the services protected by the cluster, so I believe it's not supposed to fail over the service if the administrator chose to stop the service using it. That situation might be interpreted as some maintenance that requires the service to be stopped.
您描述的 5 个工作场景不在集群管理器范围内(除了一个显式故障转移服务的选项),因此它们代表了服务在管理员不知情的情况下停止的情况(如果是管理员,他会已经使用了故障转移集群管理器,对吗?)并且集群承认这种情况是危险的,并按照预期采取行动以重新建立服务。
相关:
正确关闭群集中的 SQL Server