Eu vi várias fontes online mencionando que você sempre deve ter um script de restauração automatizado para a possível necessidade de restaurar um grande número de bancos de dados de uma só vez e voltar a funcionar rapidamente para cumprir seu SLA.
No entanto, considerando que estou executando o espelhamento síncrono em duas zonas de disponibilidade, estou lutando para encontrar um cenário no qual precisaria fazer restaurações em massa em um grande número de bancos de dados em que seria necessário criar um script para uma solução de automação de restauração.
Alguém pode me apontar um cenário realista no qual você precisaria da capacidade de fazer um grande número de restaurações de maneira roteirizada?
Então você tem duas zonas. Digamos que a zona um inunde ou queime... desapareceu completamente. Todo o hardware foi destruído e o site antigo nem pode ser usado. Pode levar semanas para colocá-lo de volta no lugar. Felizmente, você ainda está online graças à zona dois.
Claro, você pode tentar algo como servidores de leasing de curto prazo para recuperar a redundância enquanto monta sua nova instalação de produção real, mas, na verdade, o tempo gasto para colocá-los online é uma distração de sua tarefa principal, que deveria ser obter um novo primário facilidade até o rapé o mais rápido possível. Se você tentar o recurso temporário, ter os scripts de restauração ajudará muito a colocar o recurso temporário on-line rapidamente, permitindo que você volte à sua tarefa principal.
Se você não optar pela instalação temporária, qual é a capacidade do seu site da zona dois? Eu ouço o tempo todo sobre equipamentos de failover que são apenas equipamentos retirados do site principal. Isso geralmente significa equipamentos mais antigos, o que gera preocupações sobre desempenho e confiabilidade. Por quanto tempo você realmente deseja deixar essa instalação funcionando como seu único data center? Você está fazendo bons backups enquanto este site é executado como primário?
Resumindo, você não gostaria que o processo de configuração do seu novo site fosse o mais rápido, confiável e bem compreendido possível? Quanto mais tempo demorar para que a instalação principal volte a funcionar, maior a probabilidade de algo dar errado também na sua segunda instalação.
Claro, este é apenas um cenário. É o grande cenário assustador de destruição total que parece improvável que aconteça para você, e talvez até isso seja verdade. Mas esse tipo de coisa acontece em uma escala menor o tempo todo. A capacidade de fazer restaurações rápidas, confiáveis e com script para todo o seu data center para grandes emergências implica a capacidade de também fazer restaurações rápidas, confiáveis e com script para pequenas emergências. E isso é bom.