所以,我们今天遇到了一个问题,只有不到十几个用户在 OWA 中遇到超时错误。“!服务器忙服务器正忙并响应您的请求。请稍后再试。”
它们都是外部的,因此通过我们的 TMG 并仅访问我们的两台 CAS 服务器中的一台,用于他们邮箱所在的站点。该站点总共有大约 5000 个邮箱,但大多数用户在内部访问 CAS 阵列,因此在两者之间平均分配。
经检查,IIS 日志显示超过 200 个“超额预算”实例。下面的例子。
看起来问题是“CAS 中的最大有效时间”,在我运行 Perfmon 期间,Perfmon 确实显示这经常爬到 100% 以上。我们通过 Solarwinds 收集性能数据,但这不是计数器之一,所以我没有历史记录。然而,我们过去 7 天的 IIS 日志记录表明,我们通常每天看到个位数的“超额预算”。
问题是,除了删除/更改我的限制策略之外,我基本上看不到如何减少“在 CAS 中花费的有效时间”。在这台服务器上,没有什么能真正让我感到兴奋。CPU 和 RAM 都很好——它是一个双进程虚拟机,每个进程平均约 27% 的 CPU。12 GB RAM,3 GB 缓存,3 GB 可用,50 MB 免费。除了获得适当的负载平衡以分散负载之外,我实际上可以做些什么来诊断和解决这个计数器引起的问题?
2014-05-09 15:41:54 10.70.39.170 GET /owa/ &ex=E303&OverBudget(Normal/CAS),Owner:Sid~domain\username~OWA~false [Conn:2,HangingConn:0,AD:18000/ 18000/0%,CAS:90000/-2602/155%,AB:18000/18000/0%,RPC:90000/89768/1%,FC:1000/0,策略:DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b ,Norm] &v=14.3.174.1&mbx=SERVER01.company.local&sessionId=e842baf430514576aabf3ef6f372494c&prfltncy=1&prfrpccnt=0&prfrpcltncy=0&prfldpcnt=0&prfldpltncy=0&prfavlcnt=0&prfavlltncy=0&End+Budget>> Conn:2,HangingConn:0,AD:18000/18000/0 %,CAS:90000/-2602/155%,AB:18000/18000/0%,RPC:90000/89768/1%,FC:1000/0,策略:DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b,规范443 company.local\Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_9_2)+AppleWebKit/537.75.14+(KHTML,+like+Gecko)+Version/7.0.3+Safari/537。75.14 200 0 0 202
我正在添加我的答案,因为它是有效的。如果有人可以填写“为什么”这有效,这将真正解释发生了什么问题,我很乐意接受这是一个更好的答案。
我的修复:重新启动。