我们的 zimbra 服务器每隔几天就会遇到无法解释的速度下降,只有在重新启动服务器后才能解决。从最终用户的角度来看,如果他们正在使用网络邮件并发送消息,那么它最终会超时。从系统终端,登录、切换用户和重新启动 zimbra 服务都会变慢。使用“su -”更改用户最多需要 2 分钟
重新启动所有 zimbra 服务、dns 服务,并不能解决问题。问题只有在完全重新启动后才能解决。重新启动后,登录、切换用户和重新启动服务器很快就会发生。
由于 NAT,我们的环境需要使用 dnsmasq 来拆分 DNS。但是查询 DNS 会立即返回结果。我们正在使用外部 ldap 数据库进行身份验证,但使用它的其他服务器没有显示任何问题,也没有负载问题。其他一切都是默认安装和配置。
系统日志中没有明显的错误。服务器负载,磁盘IO,有问题和没问题的时候是一样的。
最初这通常在星期一或星期二每周发生一次。本周,它发生在周一和周四。
我的版本是:
zimbra@servername ~ $ zmcontrol -v Release 7.2.1_GA_2790.RHEL6_64_20120815212147 UNKNOWN_64 FOSS 版本。
有没有人遇到或解决过这样的问题?
我发现 rsyslog 在通过 TCP 将日志转发到远程主机时,有时会在无法转发到远程主机时挂起。即使远程主机恢复正常,rsyslog 仍然挂起,结果会减慢系统上尝试记录的所有其他内容。当它发生时重新启动 rsyslog 可以解决问题,但通过 cron 作业定期重新启动它似乎对我来说从来没有用过。我找到的最佳解决方案是不要让远程主机停机太多。:)
但是,可以对 rsyslog 进行一些调整,使其排队而不是锁定。您可能仍然会遇到该问题,在这种情况下,在重新启动 rsyslog 之前不会转发任何日志,但这不会影响整个系统。
注释掉您当前的转发规则,并将其放在 rsyslog.conf 的末尾:
您将需要确保 /var/spool/rsyslog 存在,否则它不会创建它。