Este é o meu cenário: sou um desenvolvedor que herdou (sem que eu soubesse) três servidores localizados em meu escritório. Eu também herdei o trabalho de ser o administrador dos servidores com uma clara falta de conhecimento de administração de servidores e google / ServerFault como ponto de referência. Felizmente, nunca tive que entrar em contato físico com as máquinas ou resolver qualquer problema, pois elas sempre "simplesmente funcionaram".
Todas as três máquinas estão localizadas na mesma sala de dados e atendem à seguinte finalidade:
Machine1
- IIS 8.0 hospedando vários aplicativos internos
Machine2
- Armazenamento de dados do SQL Server 2008 R2 para aplicativos internos
Machine3
- Armazenamento espelhado do SQL Server 2008 R2 deMachine2
Todos os três têm discos rígidos externos conectados que fazem backups com frequência.
Fui informado de que todos os três precisam passar de uma sala de dados para outra dentro das mesmas instalações. Não estarei concluindo a movimentação física do hardware, isso será feito por um transportador competente.
Além de concluir um backup completo de cada um, que considerações preciso fazer antes de hipoteticamente apertar o botão liga / desliga e observar meu mundo se mover?
Estou ciente de que está longe de ser ideal ter todos os três localizados na mesma sala / local, mas isso está além do escopo desta questão.
Pergunta genuinamente interessante, bem feita :)
Há algumas coisas que você precisa verificar antes desse movimento, algumas fáceis, outras difíceis.
Energia - verifique se a nova sala tem não apenas a quantidade certa de tomadas de energia, mas também se elas são do tipo certo - como no tipo de conector físico e se o local atual permite diferentes fases de energia por servidor para proteger contra falha monofásica, então eu 'exorto você a replicar isso também no novo local.
Resfriamento - você precisa verificar se não haverá um acúmulo imediato ou gradual de calor que levará ao superaquecimento e possível desligamento do servidor. Normalmente, você pode procurar a potência máxima (em watts) ou calor (em BTUs) que cada servidor pode consumir no site do fabricante - informe ao gerente do prédio e obtenha uma confirmação por escrito informando que o resfriamento naquele local funcionará .
Rede - essa é a difícil - não apenas o mesmo número de portas precisa ser replicado entre o local antigo e o novo, mas também o tipo, a velocidade e a configuração mais importante. Este último ponto é a chave - houve um tempo em que quase todas as portas em uma rede eram praticamente iguais - tenho idade suficiente para me lembrar desses tempos! mas hoje em dia o número de configurações de porta e o local na rede em que qualquer porta pode estar é astronômico, você precisa ter certeza de que o pessoal da sua rede replicou TUDO para ser idêntico do antigo ao novo - novamente, escreva isso por escrito como este não é fácil. Se algo der errado com esse movimento eu colocaria dinheiro, será nas portas de rede não serem idênticas, isso acontece o tempo todo.
'Outras conexões' - você sabe se seus servidores têm outras conexões além de energia e rede? talvez eles tenham links Fibre-Channel para armazenamento compartilhado, links KVM para uma tela de gerenciamento compartilhado - novamente, se você precisar replicá-los de forma idêntica.
Fora isso, sinta-se à vontade para voltar aqui com perguntas mais específicas e espero que tudo corra bem.
Outras respostas cobrem os aspectos técnicos do movimento. Você também pode ter que considerar algumas outras coisas.
Certifique-se de que os usuários saibam que seus aplicativos ficarão inativos durante a mudança. Você vai querer agendar a mudança, talvez fora do horário de trabalho, para minimizar o número de pessoas afetadas.
Faça com que uma pessoa (ou pessoas) experiente teste os aplicativos depois de ativar os servidores. Faça com que eles façam algumas verificações de sanidade para garantir que os aplicativos funcionem conforme o esperado.
Após o teste, informe a seus usuários que a mudança foi concluída e informe-os se tiverem algum problema.
É muito difícil dizer e limítrofe "muito amplo" para o nosso formato. A coisa mais importante que você precisa verificar é se precisa reconfigurar sua rede de alguma forma ou se eles podem continuar funcionando com os mesmos endereços. Mesmo que possam manter os mesmos endereços, certifique-se de que não estejam configurados via DHCP e/ou verifique se o servidor DHCP estará disponível no novo local.
Nota lateral: como você já afirmou, ter o servidor SQL e seu espelho está longe de ser o ideal. No entanto, ter as unidades de backup no mesmo local é realmente perigoso. Você precisa ter seu backup em um local físico diferente.
Outras respostas têm boas considerações pré-movimento. No entanto, você também deve planejar como organizar a mudança real. Pelo fato de Machine3 ser um espelho de Machine2 , parece que o tempo de atividade é uma consideração significativa para o(s) banco(s) de dados do SQL Server 2008 R2. O fato de ser um espelho lhe dá uma oportunidade. O motivo da existência de um espelho é estar disponível quando o servidor primário não estiver. Isso inclui não estar disponível devido a manutenção, que inclui mudança.
Faça um plano:
você deve fazer um plano por escrito de como a mudança será realizada. Você pode precisar fornecer este plano, ou partes dele, para pessoas que lidam com partes do trabalho (por exemplo, as mudanças). Este plano deve incluir todas as atividades pré-mudança, a mudança real e ações pós-mudança (por exemplo, verificação de funcionalidade).
Noções básicas de movimento:
Descrição mais detalhada do movimento:
O seguinte inclui dois métodos (Caminho A e B) de uso de Machine3 para testar as conexões para Machine1 e/ou Machine2 . Você deve usar apenas um método. A maneira de fazê-lo, ou mesmo se usar qualquer um, depende de informações não contidas na pergunta (por exemplo, separação física dos locais finais das máquinas, tamanho físico das máquinas, comprimento dos cabos de rede/alimentação, disponibilidade de extensões para os mesmos, semelhança de configurações de porta de rede, necessidades de tempo de atividade, etc.). Usar Machine3 para testar essas conexões potencialmente permite maior tempo de atividade para Machine2 , mas particularmente para Machine1 , que não possui espelho. Você pode optar por usar um dos métodos ou nenhum.
Mova Machine3 primeiro.
Caminho A: (Opcional):
Mover Máquina2 .
[Caminho B: não é necessário se você testou todas as conexões com a Máquina3 na etapa opcional nº 2] Se agora tiver a Máquina3 onde a Máquina1 deve terminar:
Mover Máquina1 .
Se algum dos IPs dos servidores for alterado e as conexões forem feitas para a caixa SQL por meio da resolução DNS, você precisará agendar uma alteração nos registros DNS ao mesmo tempo que a mudança.
Coisas que você deve saber sobre o software de intranet e bancos de dados:
Se você não obtiver exatamente os mesmos IPs ou se acabar em uma sub-rede diferente, precisará de acesso para alterar o código-fonte ou os arquivos de configuração de qualquer aplicativo que se conecte ao servidor SQL. As pessoas podem estar contando com acesso SQL não documentado e direto para relatórios ad hoc.
Utilize seus servidores de "Recuperação de desastres". Mude para eles para lidar com a carga enquanto você move seus servidores de produção. Com o equipamento DR configurado corretamente, você pode fazer a mudança no meio do dia sem ter muito tempo de inatividade (até 15 minutos). Como os servidores de recuperação de desastres devem ser configurados da mesma maneira que os servidores de produção. Se você não possui equipamento de DR, recomendo fortemente obtê-los.
Pense desta maneira: enquanto sua corveta está sendo ajustada, use sua minivan para passar o dia.
Uma coisa que acho que não foi mencionada é a segurança física da nova casa dos servidores. Para que era usado o quarto antes e quem tem as chaves dele? Existe segurança adequada (sistemas de alarme, câmeras, etc.).
Algumas considerações além das outras respostas:
Os aplicativos estão vinculados a outros, por exemplo, troca noturna de dados por arquivo ou pelo uso de webservices? Quais são as consequências quando os aplicativos não estão disponíveis? Os aplicativos relacionados podem lidar com isso ou eles falham ou até produzem resultados errados devido à falta de informações de seus aplicativos?
Um tempo de inatividade é aceitável para seus usuários, empresa ou mesmo clientes? Quanto tempo pode ser?
Eu acho que é uma boa ideia ter um plano para uma reversão. Você pode usá-lo no caso de um problema que não pode ser resolvido rapidamente, por exemplo, um problema de rede. Você provavelmente precisará manter o movedor disponível para o caso de trazer o hardware de volta.
Seus aplicativos levam a um alto tráfego de rede e a rede precisa estar preparada para isso (provavelmente um problema muito mais improvável do que problemas com endereços e firewalls)? Se você tiver aplicativos em tempo real (por exemplo, software de videoconferência), as latências serão importantes.
Os servidores devem caber no rack do servidor, se você tiver um.