Sou DBA há cerca de 2 anos e há algumas sutilezas que ainda não entendo sobre os grupos de disponibilidade AlwaysOn. Em primeiro lugar, eles não foram nada além de problemas, tanto quanto posso dizer, principalmente por causa de uma situação que ocorre com frequência em nosso ambiente.
Fazemos patches do Windows uma vez por mês, com as reinicializações esperadas do servidor. Aproximadamente uma vez por mês, encontramos uma situação em que clusters com vários grupos de disponibilidade se dividem entre os nós de um cluster.
Se estou agendando trabalhos de backup, geralmente administro os trabalhos por meio da administração de vários servidores a partir de um servidor mestre. Faço isso na resolução do ouvinte, pois ele se conecta ao nó primário de um grupo de disponibilidade. O problema é que, se eu especificar "todos os bancos de dados", todo o nó tentará fazer backup, independentemente do status primário/secundário de um determinado grupo de disponibilidade.
Como resultado, muito ruído é gerado em nossas soluções de monitoramento, pois qualquer cluster com grupos de disponibilidade difusos retorna um status de falha para o backup, pois a falha ocorre na tentativa de fazer um backup normal (não somente cópia) em um AG secundário.
Preciso fazer scripts de trabalhos para serem executados por grupo de disponibilidade nesses casos?
Existe uma combinação de configurações que faz backup apenas de um grupo de disponibilidade primário para esse nó?
Eu defendi a consolidação dos grupos para que possamos administrar pelo SERVER em vez de pelo AG. Meus chefes argumentam que deveríamos usar AGs para balanceamento de carga entre clusters, de modo que não estejamos pagando uma licença SQL para um nó que usamos apenas para HADR. Eu apresentei tudo o que pode dar errado com esses AG's difusos, mas talvez haja algo que eu não esteja ciente.
Para maior clareza, entendo que podemos apontar ouvintes para os diferentes AGs e que eles se conectarão ao primário de seu respectivo nó. Eu simplesmente não consigo gerenciar qualquer tipo de plano de backup genérico que não produza conflitos de capacidade de monitoramento e gravação contra essas situações de AG dividido. Qualquer clareza que alguém possa oferecer seria muito apreciada.
Os scripts de backup com reconhecimento de Grupo de Disponibilidade devem existir em todos os nós que possivelmente podem hospedar a cópia primária de cada banco de dados. Isso permite que o nó ativo faça o backup, evitando relatórios de erros de nós onde o banco de dados está em modo secundário ou somente leitura.
Existem várias soluções excelentes de backup com reconhecimento do Grupo de Disponibilidade, como as de Ola Hallengren ou o MinionWare Backup do Midnight DBA