我们有一个 Windows Active Directory 域,其中包含两个域控制器(主要拥有所有 FSMO 角色,以及一个额外的)和一个 Exchange 服务器。主要和次要都是 Windows Server 2008(功能级别是 2008),从 WinServ 2003 升级而来,而 Exchange 也是从 Exchange 2003 升级而来的 2010,也在 Win Serv 2008 机器上。我们的主 DNS 服务器位于 Exchange 服务器中。直到昨天,一切都很好。
今天早上,我们到工作时发现客户端机器的outlook断开连接,无法连接到Exchange服务器。我检查了服务器上的 Exchange 管理控制台并收到错误:
Initialization Error.
The following error occurred when searching for On-Premises Exchange Server:
Exception calling "GetComputerSite" with "0" arguments: "The computer is not in a site." It was running the command 'Discover-ExchangeServer -UseWIA $true -SuppressError $true'.
EMC 在 Exchange 的本地服务器中,但是,我尝试检查连接性并 ping 了服务器:
C:\Users\username>ping exchange-server
Pinging exchange-server.mydomain.com [fe80::8daa:5c0d:ee2d:32e6%11] with 32 bytes of data:
Reply from fe80::8daa:5c0d:ee2d:32e6%11:> time<1ms
Reply from fe80::8daa:5c0d:ee2d:32e6%11: time<1ms
Reply from fe80::8daa:5c0d:ee2d:32e6%11: time<1ms
Reply from fe80::8daa:5c0d:ee2d:32e6%11: time<1ms
Ping statistics for fe80::8daa:5c0d:ee2d:32e6%11:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss), Approximate round trip times in milli-seconds:
Minimum = 0ms, Maximum = 0ms, Average = 0ms
好吧,我们不使用 IPv6!然后我从本地连接中禁用了 IPv6。再次 Ping 产生:
C:\Users\username>ping exchange-server
Pinging exchange-server.mydomain.com [::1] with 32 bytes of data:
Reply from ::1: time<1ms
Reply from ::1: time<1ms
Reply from ::1: time<1ms
Reply from ::1: time<1ms
Ping statistics for ::1:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 0ms, Maximum = 0ms, Average = 0ms
但是,ping 域控制器是正常的。我编辑了hosts文件C:\Windows\system32\drivers\etc\hosts
并添加了服务器的IP地址,然后ping是正确的。我再次检查了 DNS 服务器中的 DNS 记录(恰好与交易所是同一台服务器)。
然后我试图检查服务。所有服务似乎都工作正常,所以我尝试重新启动服务。然后Microsoft Exchange Transport
失败的被卡在了starting
,禁止我再次停止/启动它。同样的Microsoft Exchange Active Directory Topology
,失败是因为Error 1053: The service did not respond to the start or control request in a timely fashioned.
......
然后我检查了域控制器事件日志,发现一夜之间启动了重启:
The process C:\Windows\system32\svchost.exe (mydomain-DC) has initiated the restart of computer mydomain-DC on behalf of user NT AUTHORITY\SYSTEM for the following reason: Operating System: Recovery (Planned)
Reason Code: 0x80020002
Shutdown Type: restart
Comment:
而且我很确定我们没有计划进行任何恢复!(编辑:它是由安全更新引起的,如事件查看器日志所示)。这是一夜之间发生的唯一一件奇怪的事情。Active Directory 服务已启动并已成功重新启动。
但是,我重新启动了两台机器,一切都恢复到重新启动前的状态,除了大多数 Exchange 服务没有启动(并且无法启动)。
我有一种感觉,我在挖掘错误的方向(AD 中问题的方向)。什么可能导致问题?
我发现了问题所在。仔细阅读域控制器事件(如 Nathan C 所示),在重新启动后显示域控制器的 IP 地址位于Active Directory 站点中不属于该站点的子网中和服务。这是一周前设置新站点时的错误配置,直到重新启动DC(因为安全更新!)之前没有明显效果...
编辑:指出问题的特定事件(供参考)是事件 ID 5802,说: