根据 MS docs,描述为AVG_RANGE_ROWS
:
直方图步骤中具有重复列值的平均行数,不包括上限。当 DISTINCT_RANGE_ROWS 大于 0 时,通过将 RANGE_ROWS 除以 DISTINCT_RANGE_ROWS 来计算 AVG_RANGE_ROWS。当 DISTINCT_RANGE_ROWS 为 0 时,AVG_RANGE_ROWS 为直方图步骤返回 1。
我正在查看最后一行,如果确实如此,我很想知道为什么我在直方图步骤中看到的值AVG_RANGE_ROWS
不等于1
when DISTINCT_RANGE_ROWS
is 。0
有问题的统计信息是 SQL Server 在自动创建统计信息选项打开时创建的列统计信息。我使用的是旧版本的数据库,但使用的是最新补丁 - SQL Server 2014 SP3、CU4+GDR (12.0.6372.1)。
有点不幸的是,上周我们几乎因为一个次优的查询计划而崩溃。最终结果是大扫描和臃肿的内存授权。用更高的百分比值重新采样统计数据暂时为我们解决了这个问题,但我很想知道初始语句周围是否有异常或已知问题(可能使用跟踪标志解决?)以及如何对于我们无法控制采样大小的自动创建的统计数据,我是否可以防止这种情况再次发生?
正如对错误形成的直方图导致对嵌套循环的错误估计的回答中所述,计算和存储采样统计信息的方式发生了变化,尤其是在应用缩放时。
作为副作用,
DISTINCT_RANGE_ROWS
在您的情况下,值是 0 到 1 之间的分数(980.235 / 386212.6 = 0.002538071)。该列的公开类型为bigint
,因此它向下舍入为零。显然,当范围包含非零行数时,实际上不可能有零不同值。
只能希望这些差异在某个阶段得到消除;虽然很难想象如果没有数据类型的潜在破坏性更改会是什么样子,也扩展到
sys.dm_db_stats_histogram
(在 SQL Server 2016 及更高版本上可用)。至于你对此做了什么,如果你确信这不仅仅是一个显示问题,而且实际上导致了糟糕的估计,你应该将其报告为回归。