症状:我们的邮件服务器,一个带有 zimbra 的专用 Fedora 服务器停止工作,我们甚至无法使用 SSH 登录。通过我们的 Web 管理控制台进行的软重启确实使它再次工作,持续了 6-8 小时,然后崩溃了。将 Zimbra 服务和整个服务器置于自动重启状态并没有帮助。
这些症状持续了几个月。现在机器恢复正常工作。
我发现的唯一可疑之处是,在这些故障期间,服务器无法找到到自己的路由,但我们的 DNS 仍然启动并能够找到这些名称。谷歌搜索类似的症状几乎没有帮助,我们的 ISP 更不友好。
问题是我几乎不知道从哪里开始寻找这些故障的原因,以防止它们发生。我应该从哪里开始?
我想这可能与机器“无法找到自己”有关。我做了一个练习,将机器自己的 IP 地址放在 /etc/hosts 中,这样无论一个特定的服务是否绑定到 127.0.0.1 XOR到外部地址,它都能够连接到该服务。
我同意,您提供的信息非常少,问题描述非常广泛。
如果一切都停止工作,那么可能是 NIC 故障或路由问题?
根据您提供的信息,很难给出任何结论性的答案。看来您需要的是系统管理员。雇一个。