我有两个 nginx 充当 Web 代理服务器,两个 Ubuntu 18.04.4 都已完全更新。他们正在使用keepalived进行故障转移,因此如果一个死了,另一个会接管。它们位于 DMZ 网络中,并将请求转发到不同子网中的多个网络服务器。我不能直接从公司局域网访问它们,我必须从网络服务器网络中的另一台计算机代理。
我遇到了一些我无法弄清楚的事情:主节点有时不再响应 Web 请求。我不能再从 webservers 子网 ssh,但是如果我登录到从属双胞胎并 ssh 到它,它会立即工作。服务器负载非常低,一切正常。一旦我停止keepalived
(并且 Web 流量通过虚拟 IP 在从属设备上路由),一切都会恢复正常,我可以从 LAN SSH。
我在 Zabbix 中添加了 TCP 连接监控,但代理在 webservers 网络中,因此在停机期间无法连接。就在突破之前,连接看起来很正常。
当我在 Zabbix 中看到它报告另一个停电时,即使是强连接仍然在从代理上路由,所以问题不太可能是连接耗尽。在此期间我无法从奴隶连接。
两台服务器都是托管在外包托管环境中的虚拟机,所以我不知道虚拟化细节。
如果有人知道我可以在哪里查看问题可能是什么...谢谢
最终成为一些有趣的系统管理员,将主服务器的 IP 分配给 DMZ 中的另一台设备