我支持制造商的ERP系统。我们在由第三方云提供商托管在 VMware 上的数据库上遇到间歇性应用程序性能问题。(他们是一个较小的供应商......不是谷歌、微软、亚马逊等。)我一直在想,他们的商业利益决定将尽可能多的客户虚拟机推到一个主机上,因为他们可以逃脱,并且我不知道我们是否由于 CPU 就绪时间长、内存膨胀或磁盘资源争用而导致性能下降。当然,他们的销售人员描绘了一幅美好的图画,但如果我在追寻其他未知数,我怎么能确定问题出在哪里?如何在不访问主机的情况下排除堆栈的基础设施层?我看到每个内核的 CPU 使用率都达到 100%,并且在查看正在运行的数据库会话时找不到明显的解释。(有时作业运行得很快,有时几乎相同的作业挂起而没有明显的阻塞。)
在不久的将来,迁移到另一家供应商或将这些机器采购到我们自己的服务器机房都不太可能,但如果有确凿的证据来推动我们从这里采取下一步行动,那就太好了。
编辑:来宾机器正在运行 Windows 2008 R2 Datacenter。