我从几天前就注意到了同样的重复消息,我可以肯定地说在那段时间没有故意改变(安装/卸载)。
这是/var/log/kern.log消息的示例:
Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down
Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down
Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down
Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
从完整的日志文件中-当将所有此类日志消息计入计数时-我可以得出结论:
- eth0 每隔几个小时就会失败一次
- eth0 在第一种情况下失败两次,在第二种情况下失败 19 秒
我在这里谈论的是生产服务器。
如何解决这个问题,因为邮件服务器处于生产状态并且我不能容忍持续 19 秒的网络故障?
ifconfig
。如果非零,则硬件(电缆、NIC 卡或集线器/交换机)有问题。不可靠的以太网电缆也会在该领域产生错误。ethtool
并确保网络设置(双工等)与交换机上的设置相匹配。如果您不是交换机的管理员,请让网络管理员为您提供设置。作为旁注,您应该评估是否需要流量控制。根据惠普的说法,它只对高性能应用程序是必需的:请参阅惠普关于何时使用流量控制的文章
这是我的解决方法。这个问题发生在特定硬件上(在一台机器上只有 NIC 上 2 个端口中的 1 个),始终使用 e1000e 驱动程序,因为内核 3.9 左右。此文件适用于 centos7,进入
/etc/init.d/
并且必须使用chkconfig --add <name>
. 接口名称是硬编码的……一定要设置它。