我们有一些内部进程将电子邮件发送到我们的 Exchange 2003 系统(在 Win2K3 R2 32 位上)。最近,他们因各种错误而间歇性失败——归结为他们报告“Exchange 拒绝连接”。我们使用 XWall 作为我们的垃圾邮件过滤器(以及用于 Outlook 客户端集成的 XWall 过滤器),它还报告“无故关闭连接”,这可能表明 Exchange 服务器在跟上问题。
我们只有大约 25 个用户邮箱(总共大约 20-25GB)并且机器上的 CPU 负载没有固定(它是 8 核戴尔 w/4GB RAM)。我的猜测是它以某种方式受 I/O 限制。我们收到了一吨垃圾邮件,我猜这个盒子跟不上。我将如何诊断这个(用户邮箱没有报告任何问题)?我应该看什么才能看到瓶颈在哪里——磁盘 I/O?网络输入/输出?中央处理器?ETC。?如何调整 Exchange?
是的,我可以查看任务管理器,但这并不能真正告诉我任何事情。谢谢!!
Perfmon 是你的朋友。绘制 CPU(利用率百分比、用户模式与内核模式百分比、上下文切换)、磁盘(队列长度、磁盘时间百分比)和内存(页面错误/秒、工作集大小)的总性能图表。这会给你一个开始寻找的地方。如果您对 IO 最感兴趣,您可能会获取与 IO 相关的 Exchange 服务的“进程”计数器(IO 读/写字节或每秒操作数)并将其也显示在图表上。
在不了解更多详细信息的情况下,很难告诉您要查看 Exchange 服务上的哪些计数器。我还没有看到很多 Exchange/Windows SMTP 服务不响应连接的情况。实际上,听到它没有回答 SMTP 让我感到惊讶。我想知道您是否也可能在这里遇到网络问题。您可能会考虑嗅探 XWall 机器和 Exchange 之间的流量(如果您能在行动中捕捉到它),看看这是否真的是未应答的 SMTP 会话的问题。
您可以启用诊断日志记录并或多或少地实时查看正在发生的事情。如果您还没有尝试阻止垃圾邮件源自的域或 IP 范围,您也可以考虑尝试阻止这些域或 IP 范围。
这台服务器除了 Exchange 之外还有其他功能(CPU 很多)吗?
你用OWA吗?您是否启用了 /3GB 启动开关?(这些并不总是一起玩得很好)。
用户使用什么客户端连接,如果 Outlook 使用“Exchange 代理”?
存储是什么样的(本地/SAN、SATA/SAS、RAID 级别)。您应该看到只有 25 个用户的问题太多了。
交换环境有很多角度可以看......
我要做的第一件事是使用进程资源管理器来确定瓶颈在哪里,是磁盘还是 RAM 等。一旦你知道你可以看看解决是什么原因造成的。最简单的选择显然是向它扔硬件,更多的 RAM 或更快的磁盘会有所帮助,或者将 Exchange 移动到它自己的磁盘。如果这是由垃圾邮件引起的,您还可以考虑在垃圾邮件到达 Exchange 之前放入前端服务器来处理垃圾邮件,例如 postfix。
至于配置修复,您可以考虑让 XWall 在垃圾邮件到达 Exchange 服务器之前尽可能多地丢弃它,这将有助于减少 Exchange 上的负载。