不是一个技术问题,但仍然是一个有效的问题。设想:
HP ProLiant DL380 Gen 8 配备 2 个 8 核 Xeon E5-2667 CPU 和 256GB RAM,运行 ESXi 5.5。给定供应商系统的八个 VM。四个 VM 用于测试,四个 VM 用于生产。每个环境中的四台服务器执行不同的功能,例如:Web 服务器、主应用程序服务器、OLAP DB 服务器和 SQL DB 服务器。
CPU 份额配置为阻止测试环境影响生产。SAN 上的所有存储。
我们对性能有一些疑问,供应商坚持认为我们需要为生产系统提供更多内存和 vCPU。但是,我们可以从 vCenter 清楚地看到,现有的分配并没有被触及,例如:主应用服务器上 CPU 利用率的月度视图徘徊在 8% 左右,奇数峰值高达 30%。峰值往往与备份软件的启动相吻合。
RAM 上的类似情况 - 服务器的最高利用率约为 35%。
因此,我们一直在进行一些挖掘,使用 Process Monitor (Microsoft SysInternals) 和 Wireshark,我们对供应商的建议是他们首先进行一些 TNS 调整。然而,这不是重点。
我的问题是:我们如何让他们承认我们发送给他们的 VMware 统计数据足以证明更多 RAM/vCPU 无济于事?
--- 2014 年 12 月 7 日更新 ---
有趣的一周。我们的 IT 管理人员说我们应该对 VM 分配进行更改,我们现在正在等待业务用户的一些停机时间。奇怪的是,业务用户说应用程序的某些方面运行缓慢(与什么相比,我不知道),但是当我们可以关闭系统时,他们会“让我们知道”(抱怨,抱怨!)。
顺便说一句,系统的“慢”方面显然不是 HTTP(S) 元素,即:大多数用户使用的“瘦应用程序”。这听起来像是主要金融机构使用的“胖客户端”安装,显然是“缓慢”的。这意味着我们现在正在研究中考虑客户端和客户端-服务器交互。
由于这个问题的最初目的是寻求帮助,是否要走“戳它”的路线,或者只是做出改变,我们现在正在做出改变,我会用longneck的回答来结束它。
谢谢大家的意见; 像往常一样,serverfault 不仅仅是一个论坛——它也有点像心理学家的沙发:-)