我们的 ESX 上的服务器出现问题。所有其他机器正常运行,但不是这台机器。它是唯一在我们的 ESX 上运行的 Linux 服务器(所有其他服务器都在 Windows 上运行),也是唯一有这个问题的服务器。
它在 3 周前安装并正常运行到上周四。从今天开始,它开始随机断开与特定主机的连接。例如,我正在使用已安装软件的 Web 界面和打开的 SSH 连接(用于查看日志)。突然,我的浏览器和我的 SSH 连接因“连接被拒绝”而中断,我无法重新连接,尽管 ping 正常工作。对我的同事来说,一切正常。后来我能够再次连接,而我的同事却没有。似乎只有 2-3 人能够同时连接到服务器。
服务器有一个静态 IP 地址,并且我们的 DNS 中有一个静态租约(基于 Microsoft Active Directory)。
产品安装过程中应用的配置:
ulimit -n 8800
echo "* soft stack 32768" >> /etc/security/limits.conf
echo "* hard stack 32768" >> /etc/security/limits.conf
echo "* soft nofile 65536" >> /etc/security/limits.conf
echo "* hard nofile 65536" >> /etc/security/limits.conf
echo "* soft nproc 16384" >> /etc/security/limits.conf
echo "* hard nproc 16384" >> /etc/security/limits.conf
防火墙已关闭 ( service firewalld stop
),这并没有改变任何东西。我在消息日志文件中没有看到任何内容。
安装的软件:
- 美分操作系统 7
- IBM Business Process Server Advanced 8.5.6(基于 IBM WebSphere)
- IBM DB2 Express
我是一名具有基本网络和 Linux 知识的开发人员,但我的想法已经不多了。有没有你建议我检查的日志?我该如何调试这个系统?