Eu tenho um servidor Exchange 2016 que funciona com cerca de 14 dias entre eles. O servidor é virtual e existe em um ambiente vmware em cluster com armazenamento via iSCSI. Nenhum dos outros servidores Windows que executamos (incluindo a cópia passiva do Exchange) bsods. O Exchange passivo está recebendo backup e limpa os logs de transação como deveria no nó passivo e ativo.
- Eu tentei instalar os patches críticos mais recentes (nenhum dos opcionais ainda)
- Tentei migrar a VM em questão para um novo host.
Aqui está o que o visualizador BSoD me dá de informações:
052716-21921-01.dmp 27.05.2016 10:22:16 CRITICAL_PROCESS_DIED 0x000000ef ffffe000`de10d080 00000000`00000000 00000000`00000000 00000000`00000000 ntoskrnl.exe ntoskrnl.exe+14e3a0 NT Kernel & System Microsoft® Windows® Operating System Microsoft Corporation 6.3.9600.18289 (winblue_ltsb.160328-1315) x64 ntoskrnl.exe+14e3a0 C:\Windows\Minidump\052716-21921-01.dmp 8 15 9600 138 150 27.05.2016 10:22:47
051516-25765-01.dmp 15.05.2016 10:11:06 CRITICAL_PROCESS_DIED 0x000000ef ffffe001`0ad80900 00000000`00000000 00000000`00000000 00000000`00000000 ntoskrnl.exe ntoskrnl.exe+14e3a0 NT Kernel & System Microsoft® Windows® Operating System Microsoft Corporation 6.3.9600.18289 (winblue_ltsb.160328-1315) x64 ntoskrnl.exe+14e3a0 C:\Windows\Minidump\051516-25765-01.dmp 8 15 9600 138 150 15.05.2016 10:11:41
042816-19328-01.dmp 28.04.2016 22:36:50 CRITICAL_PROCESS_DIED 0x000000ef ffffe001`3da4f900 00000000`00000000 00000000`00000000 00000000`00000000 ntoskrnl.exe ntoskrnl.exe+14e8a0 NT Kernel & System Microsoft® Windows® Operating System Microsoft Corporation 6.3.9600.18289 (winblue_ltsb.160328-1315) x64 ntoskrnl.exe+14e8a0 C:\Windows\Minidump\042816-19328-01.dmp 8 15 9600 294 472 28.04.2016 22:39:45
041916-23859-01.dmp 19.04.2016 08:43:53 CRITICAL_PROCESS_DIED 0x000000ef ffffe001`23101900 00000000`00000000 00000000`00000000 00000000`00000000 ntoskrnl.exe ntoskrnl.exe+14e8a0 NT Kernel & System Microsoft® Windows® Operating System Microsoft Corporation 6.3.9600.18289 (winblue_ltsb.160328-1315) x64 ntoskrnl.exe+14e8a0 C:\Windows\Minidump\041916-23859-01.dmp 8 15 9600 294 472 19.04.2016 08:47:04
Eu vi uma postagem com o mesmo problema em um site diferente, mas nenhum realmente respondeu ao problema e a postagem envelheceu.
Alguém tem alguma indicação de como consertar isso? Eu teria que instalar OUTRO servidor Exchange e migrar para ele? Isso seria muito lamentável..
Seu sistema de armazenamento está falhando ou muito lento para acompanhar. Se o IO estiver parado por muito tempo, o Exchange pensa que o armazenamento está morto e mata o Wininit para forçar a reinicialização total.
Consulte https://technet.microsoft.com/en-us/library/ff625233.aspx e role até o final. É o mesmo para 2013 e 2016.
Eu experimentei isso em primeira mão ao usar o Backup do Windows Server para fazer backup do Exchange. Quando o backup começar, ele fará uma verificação de consistência em todos os bancos de dados em paralelo. Isso fez com que o Exchange fosse BSOD após alguns minutos quando o armazenamento caiu.
A primeira solução é desabilitar a pulsação do ATS para a matriz de armazenamento https://kb.vmware.com/kb/2113956
O texto é muito longo para copiar, mas TL;DR: Sua conexão de matriz de armazenamento pode cair sob forte IO quando a pulsação ATS de 8 segundos expirar, o que causará o tempo limite de IO na VM, fazendo com que o Exchange seja BSoD.
A solução secundária é adicionar controladores de armazenamento à VM e distribuir discos de banco de dados entre os controladores. No meu caso, um único controlador pvscsi iria sufocar gravemente em 6 bancos de dados, mas quando os discos (incluindo o disco do sistema operacional, etc.) foram distribuídos por 4 controladores pvscsi, os problemas desapareceram. Não tenho referência para isso, apenas experiência pessoal no vSphere 5.5 U3.
Você pode emitir um comando para desativar a reinicialização forçada do ESE, a causa é bem explicada pela resposta de Don.
Eu fiz isso recentemente para um cliente com um único servidor com ESXi, pois o IO estava superando o Exchange. (ainda está matando, pois leva anos para simplesmente abrir um console de gerenciamento, por exemplo, mas pelo menos não reinicia ..)
Lá você precisa usar a versão correta do Exchange.
Veja aqui a versão do Exchange; https://technet.microsoft.com/en-us/library/hh135098(v=exchg.150).aspx
Veja aqui para mais detalhes; http://www.tecfused.com/2014/11/exchange-2013-dag-bsod/