Asked: 2023-02-21 01:34:05 +0800 CST

如何优化聚合然后在单个表中复制大量记录的查询

在下面的帖子中，JD 提出我有一个性能不佳的查询。

我在 SQL Server 2019 标准版上运行此查询（查询计划是在开发版中生成的）

让我们在这里看一下：

INSERT INTO [dbo].[tbl_Planning_Operational_Data_Exploded] (
    [ScenarioID]
    ,[CompanyID]
    ,[OperationalAccountID]
    ,[CurrencyID]
    ,[CustomerID]
    ,[ItemID]
    ,[CalendarDate]
    ,[Amt]
    ,[PlanningOperationalDataActualTransactionAttributeValueExplodedID]
    )
SELECT ats.[ScenarioID]
    ,pode.[CompanyID]
    ,pode.[OperationalAccountID]
    ,pode.[CurrencyID]
    ,pode.[CustomerID]
    ,pode.[ItemID]
    ,pode.[CalendarDate]
    ,SUM(pode.[Amt]) AS Amt
    ,'00000000-0000-0000-0000-000000000000' AS [PlanningOperationalDataActualTransactionAttributeValueExplodedID]
FROM #ActualThroughScenarios ats WITH (NOLOCK) --Mini 100 records
INNER JOIN [dbo].[tbl_Core_Scenarios] cs WITH (NOLOCK) ON cs.ScenarioID = ats.ScenarioID --Mini 100 records
    AND cs.ScenarioTypeID IN (
        2
        ,3
        )
INNER JOIN [dbo].[tbl_Core_Scenarios] csActuals WITH (NOLOCK) ON csActuals.FiscalYear = cs.FiscalYear --Mini 100 records
    AND csActuals.ScenarioTypeID = 1
INNER JOIN [dbo].[tbl_Planning_Operational_Data_Exploded] pode ON pode.ScenarioID = csActuals.ScenarioID -- Huge up to 300 million records
INNER JOIN [dbo].[tbl_Core_Fiscal_Date] cfd WITH (NOLOCK) ON pode.CalendarDate = cfd.CalendarDate  --Mini 1000 records
WHERE cfd.FiscalPeriod <= cs.ActualsThrough
    AND cs.ActualsThrough > 0
GROUP BY ats.[ScenarioID]
    ,pode.[CompanyID]
    ,pode.[OperationalAccountID]
    ,pode.[CurrencyID]
    ,pode.[CustomerID]
    ,pode.[ItemID]
    ,pode.[CalendarDate]

查询计划生成：https://www.brentozar.com/pastetheplan/? id=Sk69AQ-As

基本上这个查询非常简单，我有一个非常大的表“Exploded”，我需要对其进行分段，对它们进行分组并修改“ScenarioID”，然后将它们重新插入到同一个表中。

我可以优化或转移所有小表的索引策略，但在数据库的其他部分（未显示有很多）向“Exploded”表添加索引非常昂贵，我宁愿不添加任何额外的索引那张桌子

正如在上面的链接帖子中提到的，这个查询可以运行可以运行得非常慢，因为它会生成一个非常大的哈希匹配，我认为这是通过这样做的组，但我需要组依据，那个和求和是什么的关键部分我在这里做：

这会溢出到 TempDB 并受 TempDB 速度的严重影响。鉴于我对相关表的约束，有什么方法可以改进上面的查询吗？

David Rogers

Asked: 2023-02-18 13:55:40 +0800 CST

AWS 到 Azure 的性能下降与“哈希匹配（聚合）步骤”/“临时磁盘”TempDB 性能问题

好的，所以我有一系列 AWS VM，主要使用内置 SQL Server 2019 的z1d.3xlarge服务器类，这些服务器每个都包含一个不同大小的 NVMe。（不足为奇）我将我的 SQL Server TempDB 驱动器放在这个驱动器上，运行良好，没问题。

现在我正在尝试在 Azure 上做完全相同的事情，在这种情况下，我使用的是“标准 E4bds v5”类和 SQL Server 2022 开发许可证，同样的交易，附加的 NVMe，高性能（由“atto”验证对它进行基准测试，它实际上预制得更好），应该工作正常，除了它不......

例如，我有一个查询在任何一台服务器上运行时都会产生大量 TempDB 溢出（在两台服务器上生成相同的查询计划）：

蔚蓝

AWS（完全相同的计划）

相同的查询、相同的计划、相同的 tempDB 溢出，在 AWS 服务器上，3 分钟，在 Azure 服务器上，11 分钟。为什么？很好地分配了各种等待统计和 perfmon，当 TempDB 溢出发生在 Azure 服务器上时，它会以每秒 25MB 的速度排序站点：

如果你在 AWS 服务器上运行同样的东西，你会看到高达每秒 900MB 的峰值。看看这个，我相信导致 TempDB 驱动器 IO 性能降低的任何因素也会导致运行时间延长。我研究了以下因素：

CPU：两台服务器上的 CPU 通常都很低，大部分时间低于 10%

内存：这个查询只导致 SQL Server 占用大约 1GB 左右，它使用的内存非常少，服务器上只使用了 12% 的内存，我禁用了分页并启用了锁定内存，没有效果

其他磁盘 IO：一切都是高级 SSD，基准测试很棒，在 Perfmon 中看起来不错，我可以在资源监视器中看到大部分使用都集中在“D”驱动器（tempDB）上：

活动监视器：运行时只显示一堆读取，少量 BufferIO 等待：

这种性能不佳的最可能原因是什么，TempDB 速度的瓶颈是什么（在这种情况下但不是在其他查询中），我将如何确定导致查询速度差异的两台服务器之间的差异？

更新 1

根据 JD 的要求，我已在每台服务器上的 TempDB 驱动器的 CrystalMark 基准测试下方发布

AWS 临时驱动器性能：

Azure 临时驱动器性能：

出于某种原因，该基准测试显示 Azure 驱动器的性能比 AWS 驱动器的性能差（这与显示相反结果的 ATTO 基准测试结果不同）。也许这就是正在发生的事情，到目前为止我一直专注于“ Ebsv5 系列”，我将尝试获得更大的服务器，理论上应该在所有驱动器上为我提供更多的“IOPS/MBps”（不是确定这是否会影响 NVMe 的...）。

我还将对更大的服务器进行基准测试，看看它的性能是否更好，我将在此处发布结果。

更新 2

是的，JD 是对的，“Standard_E16-8ads_v5”更好看：

如何优化聚合然后在单个表中复制大量记录的查询

AWS 到 Azure 的性能下降与“哈希匹配（聚合）步骤”/“临时磁盘”TempDB 性能问题

蔚蓝

AWS（完全相同的计划）

更新 1

更新 2

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

David Rogers's questions

蔚蓝

AWS（完全相同的计划）

更新 1

更新 2