Estou no processo de demonstração do SRM da VMware.
A instalação é boa e posso facilmente executar uma restauração para uma única máquina.
Estou desenvolvendo um script de recuperação para um único aplicativo espalhado por cerca de 10 servidores, alguns servidores sql, alguns servidores de aplicativos, uma máquina de acesso do cliente entre alguns outros.
Os grupos prioritários são definidos exatamente como deveriam ser e não preciso adicionar nenhuma definição intragrupo.
Quando testo meu plano de recuperação, vejo as VMs de prioridade 1 serem acionadas primeiro, a prioridade 2 não ser acionada e algumas - cerca de metade - das VMs de prioridade 3 inicializarem. Parece que as coisas eventualmente seguem em frente, ainda usando essa estranha ordem. O que diabos está acontecendo aqui? Está relacionado ao método que o SRM usa para alterar os endereços IP? Algo na versão do hardware e/ou VMware Tools?
Todos os hosts ESXi e vSphere são 5.5. Estou usando replicação do vSphere e SRM 5.8.1.
Depois de corrigir alguns problemas de tempo limite, consegui determinar o que está acontecendo aqui.
Parece que as etapas de preparação do SRM (configurar armazenamento, configurar rede de texto, inicialização de convidado, personalizar ip) são todas executadas começando com a prioridade 1 e passando pela prioridade 5 em grupos de aproximadamente 4 VMs por vez. Essas etapas são tratadas como independentes da inicialização de produção.
As caixas SQL na prioridade 2 são grandes. Como resultado, leva muito mais tempo para minhas caixas do grupo 2 chegarem à inicialização do convidado. O SRM não espera que o processo seja concluído nessas VMs e passa para o próximo grupo. Realmente faz sentido - todas as VMs são desligadas e aguardam para serem inicializadas na ordem correta assim que a reconfiguração for concluída.