Jeff Atwood Asked: 2009-07-03 05:42:24 +0800 CST2009-07-03 05:42:24 +0800 CST 2009-07-03 05:42:24 +0800 CST 为什么我们的 8-cpu SQL Server 机器上的 CPU 使用如此不对称? 772 我注意到运行 SQL Server 2008 的 8 CPU 数据库服务器上的 CPU 使用率根本不平衡。 以下是前一段时间随机一天的 1 天平均值,这是典型的且始终不对称: 9、15、10、21、18、21、14、9 (这里只有缩略图,因为图像真的很高,但点击查看完整尺寸的图像) 与我们的 4-CPU 网络服务器相比,这些服务器几乎一直都是完全平衡的,这让我觉得很奇怪。 现在,这是一个专用服务器,所以唯一在其上运行的是 SQL Server 2008(以及我们大量使用的内置全文索引),所以我不确定为什么 CPU 使用率会如此不对称. 想法? central-processing-unit sql-server-2008 smp 5 个回答 Voted uzbones 2009-07-03T05:51:49+08:002009-07-03T05:51:49+08:00 它们的比例都不同,除了 4 个图表上的峰值之外,您的平均值都约为 10-25%。 Best Answer Kyle 2009-07-03T05:51:52+08:002009-07-03T05:51:52+08:00 您的文件/文件组是如何设置的? 我会抄袭自己: 关于 IO 的另一个想法:我们小心地将我们最大的最常用表设置在包含多个文件的文件组上。这样做的性能增强之一是 SQL 将对文件组中的每个文件进行线程请求 - 因此,如果 BigOverUsedTable 在 FileGroup1 上并且 FileGroup1 中有四个文件并且您的数据库有 8 个核心,它实际上将使用四个核心来执行“选择来自 BigOverUsedTable 的大数字处理讨厌的查询”——否则,它将只使用一个 CPU。我们从这篇 MSDN 文章中得到了这个想法: http://msdn.microsoft.com/en-us/library/ms944351.aspx 来自 TFA: “文件组使用并行线程来改进数据访问。当按顺序访问表时,系统会为每个文件并行创建一个单独的线程。当系统对具有四个文件的文件组中的表执行表扫描时,它使用四个单独的线程来并行读取数据。通常,在单独的磁盘上使用多个文件可以提高性能。文件组中的文件过多会导致并行线程过多并产生瓶颈。 由于这个建议,我们在 8 核机器上的文件组中有四个文件。它运作良好。 编辑:这现在有另一个(可能)更好的答案。图表不符合比例——如果你仔细观察,每个处理器实际上负载了大约 20%,正如 uzbones 指出的那样。 编辑:我们实际上可以看出使用多个文件文件组会有所帮助,因为我们没有将所有表都放在包含四个文件的文件组中。对“单个文件”文件组的大查询仅使用一个 CPU,但对四个文件文件组中的表的查询会使用 4 个 CPU。 MathewC 2009-07-03T05:55:43+08:002009-07-03T05:55:43+08:00 看一下这个: http://blogs.technet.com/mat_stephen/archive/2005/02/02/365325.aspx SQL 可能只写入少数文件,并且每个处理器都在使用每个文件。 Brent Ozar 2009-07-03T06:18:49+08:002009-07-03T06:18:49+08:00 我检查类似的东西的第一件事是驱动程序。我在网络绑定和 iSCSI MPIO 驱动程序粘在特定内核上时遇到了很多问题。我敢打赌这不是问题,因为它看起来像是发生在 4 个核心上——我通常只看到 2 个核心。我会四处打听,看看有没有人看到这么宽。 我还看到了内存不匹配的 NUMA 盒子——比如一半的核心连接到 16gb 的内存,而其他的连接到 8 个。如果你想看到一些有趣的信息,请谷歌搜索 IBM x460 NUMA。460 和相关型号让您可以将多台服务器以菊花链方式连接在一起以创建大铁 - 有点与扩大与扩大博客条目相关。他们是很棒的机器。 David Pashley 2009-07-03T05:50:45+08:002009-07-03T05:50:45+08:00 因为刷新 CPU 缓存非常昂贵,内核试图不惜一切代价避免它。 (注意:至少 Linux 会这样做;如果 Windows 没有相同的行为,我会感到惊讶)
它们的比例都不同,除了 4 个图表上的峰值之外,您的平均值都约为 10-25%。
您的文件/文件组是如何设置的?
我会抄袭自己:
关于 IO 的另一个想法:我们小心地将我们最大的最常用表设置在包含多个文件的文件组上。这样做的性能增强之一是 SQL 将对文件组中的每个文件进行线程请求 - 因此,如果 BigOverUsedTable 在 FileGroup1 上并且 FileGroup1 中有四个文件并且您的数据库有 8 个核心,它实际上将使用四个核心来执行“选择来自 BigOverUsedTable 的大数字处理讨厌的查询”——否则,它将只使用一个 CPU。我们从这篇 MSDN 文章中得到了这个想法:
http://msdn.microsoft.com/en-us/library/ms944351.aspx
来自 TFA:
“文件组使用并行线程来改进数据访问。当按顺序访问表时,系统会为每个文件并行创建一个单独的线程。当系统对具有四个文件的文件组中的表执行表扫描时,它使用四个单独的线程来并行读取数据。通常,在单独的磁盘上使用多个文件可以提高性能。文件组中的文件过多会导致并行线程过多并产生瓶颈。
由于这个建议,我们在 8 核机器上的文件组中有四个文件。它运作良好。
编辑:这现在有另一个(可能)更好的答案。图表不符合比例——如果你仔细观察,每个处理器实际上负载了大约 20%,正如 uzbones 指出的那样。
编辑:我们实际上可以看出使用多个文件文件组会有所帮助,因为我们没有将所有表都放在包含四个文件的文件组中。对“单个文件”文件组的大查询仅使用一个 CPU,但对四个文件文件组中的表的查询会使用 4 个 CPU。
看一下这个:
http://blogs.technet.com/mat_stephen/archive/2005/02/02/365325.aspx
SQL 可能只写入少数文件,并且每个处理器都在使用每个文件。
我检查类似的东西的第一件事是驱动程序。我在网络绑定和 iSCSI MPIO 驱动程序粘在特定内核上时遇到了很多问题。我敢打赌这不是问题,因为它看起来像是发生在 4 个核心上——我通常只看到 2 个核心。我会四处打听,看看有没有人看到这么宽。
我还看到了内存不匹配的 NUMA 盒子——比如一半的核心连接到 16gb 的内存,而其他的连接到 8 个。如果你想看到一些有趣的信息,请谷歌搜索 IBM x460 NUMA。460 和相关型号让您可以将多台服务器以菊花链方式连接在一起以创建大铁 - 有点与扩大与扩大博客条目相关。他们是很棒的机器。
因为刷新 CPU 缓存非常昂贵,内核试图不惜一切代价避免它。
(注意:至少 Linux 会这样做;如果 Windows 没有相同的行为,我会感到惊讶)