我在一小时内看到以下 tempdb I/O 行为:
机器上执行的多个 DW 工作负载会产生大量磁盘 I/O,其中一些无法容纳分配给 SQL 的约 280GB 内存。一个有趣的方面是,如此多的 I/O 都集中在旋转磁盘驱动器 (E) 上,而不是处理 I/O 效率更高的固态驱动器(F 和 G)上。
我们已将 F 和 G 驱动器上的全部 300GB(总共 600GB)预先分配给 tempdb(使用 12 个文件),并且我们已将 1.3TB 预先分配给 E 驱动器上的 tempdb(当前为 1 个文件)。上面的 I/O 数据表明 tempdb 的使用是根据文件的当前大小分布在文件中的。我找不到关于此的文档,但我还运行了如下查询以进一步调查:
-- While running this query, writes to tempdb are distributed to E/F/G drives
-- in proportion to their current size. This was shown by both
-- sys.dm_io_virtual_file_stats and the space used on the tempdb files before and after
SELECT TOP 100000000 *
INTO #temp
FROM [A_Really_Big_Table]
理想的行为是 F 和 G 被独占使用,除非它们都已满,在这种情况下,旋转磁盘驱动器应提供额外的 tempdb 空间,以便可以在不耗尽 tempdb 空间的情况下处理偶尔非常大的工作负载。
我们是否在正确的轨道上观察到 tempdb 的使用是根据文件的当前大小分布在文件之间的?看到这种类型的分布而不是看到每个文件的平等使用有点令人惊讶(这可能是设置此硬件的人的假设,并决定只将一个文件分配给旋转磁盘上的 tempdb)。
根据 Paul White 对这个问题的回应,我们正在考虑以下方法:
- 收缩旋转磁盘上的 tempdb 文件。根据我们的初步测试,这应该会将当前的工作分配更多地转移到固态驱动器上
- 配置固态 tempdb 文件以预分配它们的空间(正如我们现在所做的那样)
- 将旋转磁盘 tempdb 文件配置为从不分配开始。确保即时文件初始化已打开。Tempdb 将仅在需要时在旋转磁盘上增长(可能最多每周一次)。
- 创建一个维护计划,在高峰负载后缩小旋转磁盘上的 tempdb 文件,使分布重新有利于固态 tempdb 文件。
这看起来合理吗?是否有任何替代方法或潜在问题需要考虑?我们显然会尽可能地测试该方法,但无法在完全等效的测试硬件上进行测试。
文件写入根据文件组中每个文件的当前大小按比例分布在同一文件组中的文件中。这被称为“比例填充算法”——查看http://sqlserver-performance-tuning.net/?p=2552了解一些有趣的细节。
tempdb
只能有一个文件组。如果您尝试在其中创建文件组,tempdb
您会得到以下信息:如果您打开了跟踪标志 1117,对于当前未达到其最大大小且磁盘上存在空间的每个文件,组内的文件将同时跨文件组中的文件自动增长。
您的实例是否打开了跟踪标志 1117?在这种特定情况下,您可能希望将其关闭,即使“最佳实践”通常表明已将其打开。Microsoft Connect 上有一个项目要求有这样的设置,可以在每个数据库的基础上启用/禁用,这里: https ://connect.microsoft.com/SQLServer/feedback/details/781198/trace-flag -1117-数据文件的自动增长是实例范围内的-想要一个标志-for-just-tempdb
假设 SSD 专用于 tempdb,我同意您的断言并建议使 SSD 上的 tempdb 尽可能大(不是 100% 的驱动器,可能留下 10% 的空闲空间)。使磁盘上的 tempdb 文件尽可能小,例如 1MB,自动增长,最大文件大小与您需要的一样大。监控 HDD 上的 tempdb 文件增长情况,如果您认为公司会从中受益,则为获得更大的 SSD 提供理由。
根据文档,SQL Server 文件可以在原始分区(尚未格式化的分区)上创建,只需在
ALTER DATABASE ... ADD FILE
语法中使用分区的驱动器号即可。这显然消除了扩大或缩小文件的需要,因为它本质上会根据需要使用整个原始分区。我不确定这是否对您的情况有帮助;只是想我会把它作为一个有趣的事实扔在那里。请参阅“如果文件位于原始分区上,os_file_name 必须仅指定现有原始分区的驱动器号。每个原始分区上只能放置一个文件。”