Atualmente, estou planejando uma nova configuração do SQL Server 2019 Enterprise Edition com HA/DR, possivelmente com grupos de disponibilidade.
Digamos que temos a seguinte configuração:
- Site A: uma instância do SQL Server (SQL1)
- Site B: uma instância do SQL Server (SQL2)
- Site C: testemunha de compartilhamento de arquivos para o cluster de failover do Windows
- Grupos de disponibilidade: AG1 (SQL1 é primário, SQL2 é secundário), AG2 (SQL2 é primário, SQL1 é secundário)
Se a conexão de rede entre o Site A e o Site B for perdida, mas ambos os sites ainda puderem alcançar a testemunha de compartilhamento de arquivos, como os grupos de disponibilidade reagirão?
- O SQL1 permanecerá como réplica primária de AG1 e SQL2, réplica primária de AG2?
- Um dos servidores ficará inativo e o outro se tornará a réplica primária para todos os grupos de disponibilidade?
- Se apenas um servidor permanecer online, qual deles vence? Aquele que atualmente possui o grupo de recursos principais do cluster?
- Outro cenário?
Até agora, todos os artigos que encontrei falam apenas sobre 1 servidor atuando como réplica primária para todos os grupos de disponibilidade. Infelizmente, ainda não tenho a infraestrutura disponível para testá-lo sozinho.
Alguém tem experiência com este cenário?
obrigada
Isso depende das configurações do cluster. Como a maioria das pessoas não configura um cluster com configurações avançadas (o que geralmente é uma coisa boa porque é muito fácil fazê-lo incorretamente e realmente estragar as coisas), vou assumir uma instalação e configuração de cluster vanilla.
Dada a suposição acima, dependendo da latência entre os sites para a testemunha e supondo que a comunicação com o compartilhamento de arquivos não tenha problemas de nenhum dos sites, o site que permanecer ativo será, na maioria das vezes , o site que possui o cluster principal grupo de recursos. Isso ocorre devido à configuração de retirada de testemunha no cluster, pois a partição que possui os recursos principais não precisará aguardar o cronômetro de retirada atrasada antes de tentar arbitrar.
Qualquer lado que atinja o quorum (que, dependendo de vários outros itens, pode ser um dos lados [ou nenhum lado se as coisas correrem muito mal]) será o lado para o qual todos os grupos de cluster se moverão, se eles podem ou não aparecer é outra história.
Como um aparte, já que sua pergunta não era sobre isso, mas devo salientar que essa não é uma ótima ideia. Dependendo da carga, pode haver problemas de desempenho que surgem de vários lugares. Se houver hardware suficiente disponível para que ambos possam ser primários no mesmo nó, poderá funcionar para fazer isso. Se não houver hardware suficiente disponível para que ambos possam ser primários no mesmo nó, isso será um grande desastre aguardando a ignição.