Na verdade, não executei esta instalação, nem sou responsável por corrigir problemas neste cluster específico. Acontece que eu estava verificando e encontrei algumas coisas que me intrigam. Meu ponto nisso é tentar entender por que está funcionando, pelo menos em algum aspecto.
SO: Windows Server 2003 Enterprise (64 bits)
SQL: SQL Server 2005 Enterprise (64 bits)
Iniciado com um cluster ativo/ativo de 2 nós: Server1 executando Instance1 e, em seguida, Server2 executando Instance2.
Instance 1 e Instance2 estão no número de compilação do service pack 3 para SQL Server 2005 (+ alguns hotfixes). Acredito que seja 9.00.4053. Dois novos servidores são construídos para substituir Server1 e Server2. Assim, os servidores foram construídos e adicionados ao cluster, Server3 e Server4. Como não fiz a instalação, estou assumindo que a pessoa seguiu as etapas para adicionar um novo nó do SQL Server conforme descrito aqui no BOL: http://msdn.microsoft.com/en-us/library/ms191545( v=SQL.90).aspx
Descobri que Instance1 e Instance2 agora estão sendo executados no Server3. No entanto, o número de compilação das instâncias agora é 9.00.1399, que é uma instalação sem patch. As instâncias estão ativas e ainda em execução neste build RTM do SQL Server dentro do cluster. ?????
Meu processo de pensamento aqui é que você não pode fazer um backup do banco de dados mestre e restaurá-lo para uma instância que está em um número de compilação menor do que o backup foi feito. Então, se você for nesse ponto, como uma instância de cluster pode fazer failover para um nó que não está no mesmo número de compilação? Por que o SQL Server (ou a Microsoft) permitiria isso?
Além disso, a última etapa no artigo BOL vinculado acima tem "Todos os nós de uma instância de cluster de failover devem estar no mesmo nível de versão". Não consigo encontrar nada que diga o que acontece se você não estiver. A única coisa que encontrei em Instance2 é que os trabalhos do SQL Agent parecem não estar mais funcionando e quando os bancos de dados estão sendo colocados online, há um despejo de pilha de algo como o ouvinte IO (não me lembro da mensagem exata mostrando ). Também vi algumas mensagens referindo-se a problemas de gravação de E/S.
Os próprios bancos de dados estão online e parece que os aplicativos estão funcionando conforme desejado. Eles têm funcionado dessa maneira na última semana. Alguma ideia?
Você provavelmente não precisa de ninguém para lhe dizer que precisa corrigir o nível de compilação nesse terceiro nó! Suspeito que esteja tudo funcionando bem devido à introdução do banco de dados de recursos no SQL2005: http://msdn.microsoft.com/en-us/library/ms190940.aspx
Lembro-me vagamente de um cluster antigo do Windows 2000 / SQL Server 2000 com o qual trabalhei, onde o SQL pensava que era um nível de patch mais baixo em um nó em comparação com o outro.