AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 134945
Accepted
Mark Sinkinson
Mark Sinkinson
Asked: 2016-04-12 00:42:22 +0800 CST2016-04-12 00:42:22 +0800 CST 2016-04-12 00:42:22 +0800 CST

SQL Server 示例统计信息更新错过了升序键列上的最高 RANGE_HI_KEY

  • 772

我试图了解统计抽样的工作原理以及以下是否是抽样统计更新的预期行为。

我们有一个按日期分区的大表,有几十亿行。分区日期是之前的营业日期,因此是一个升序键。我们只将前一天的数据加载到该表中。

数据加载整夜运行,因此我们在 4 月 8 日星期五加载了 7 日的数据。

每次运行后,我们都会更新统计数据,但会抽取一个样本,而不是FULLSCAN.

也许我太天真了,但我希望 SQL Server 识别范围内的最高键和最低键,以确保它获得准确的范围样本。根据这篇文章:

对于第一个桶,下边界是生成直方图的列的最小值。

但是,它没有提到最后一个桶/最大值。

随着 8 日上午的采样统计更新,样本错过了表中的最高值(7 日)。

在此处输入图像描述

由于我们对前一天的数据进行了大量查询,这导致了不准确的基数估计和许多查询超时。

SQL Server 是否应该不识别该键的最高值并将其用作最大值RANGE_HI_KEY?或者这只是不使用更新的限制之一FULLSCAN?

版本 SQL Server 2012 SP2-CU7。我们目前无法升级,因为OPENQUERYSP3 中的行为发生了变化,即在 SQL Server 和 Oracle 之间的链接服务器查询中舍入数字。

sql-server sql-server-2012
  • 2 2 个回答
  • 611 Views

2 个回答

  • Voted
  1. Best Answer
    Paul White
    2016-04-12T01:59:14+08:002016-04-12T01:59:14+08:00

    SQL Server 是否应该不识别该键的最高值并将其用作最大值RANGE_HI_KEY?或者这只是不使用更新的限制之一FULLSCAN?

    这是当前抽样统计信息实施的局限性。就目前而言,抽样统计信息收集使用TABLESAMPLE SYSTEM,它使用分配顺序扫描并从扫描中选择页面进行抽样。只有选定的页面才有助于直方图。

    由于扫描是按分配顺序(而不是按索引顺序)的,因此无法按关键字顺​​序优先选择第一页和最后一页。

    有关更多信息,请参阅此相关问题:

    更新统计数据时抽样如何工作?

    和我的文章,分配顺序扫描

    有关变通方法,请参阅Fabiano Amorim 撰写的关于升序列的统计信息

    • 12
  2. gbn
    2016-04-12T01:07:47+08:002016-04-12T01:07:47+08:00

    快速猜测:启用跟踪标志 4139。

    您已经在运行SP2-CU1,所以这应该可以工作

    也请注意有关 TF 2389 广告 2390 的准则,另请参阅http://sql-sasquatch.blogspot.com.mt/2013/06/mssql-plan-guides-to-address-ascending.html

    (注意,我并没有真正遇到这个问题,也没有深入研究过)

    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve