AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 177032
Accepted
John Eisbrener
John Eisbrener
Asked: 2017-06-23 08:41:50 +0800 CST2017-06-23 08:41:50 +0800 CST 2017-06-23 08:41:50 +0800 CST

临时表聚集键不被认可:错误或预期的功能?

  • 772

当我将一些测试数据集放在一起时,我注意到临时表有一些有趣的行为。在通过并行执行计划填充的集群临时表中处理大量数据时,集群键在选择数据时看起来并不重要。这个问题似乎也会影响我测试过的所有 SQL Server 版本(包括 vNext)。

这是测试的dbfiddle.uk示例。您可能需要执行几次才能得到我找到的结果,但执行一次或两次以上才能产生相同的结果。此外,这是我在我的环境中获得的本地执行计划,它表明大数据集和小数据集之间的唯一区别是数据被馈送到表中的方式(例如并行计划与串行计划)。

如果你想在家玩,这是我正在运行的测试:

-- Large Data Set
CREATE TABLE #tmp
(
    ID  INT PRIMARY KEY CLUSTERED
)

INSERT INTO #tmp
-- Purposely insert in reverse order
SELECT TOP 100 PERCENT RN
FROM
(
    SELECT TOP (10000000) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) RN
    FROM master..spt_values t1
    CROSS JOIN master..spt_values t2
) x
ORDER BY RN DESC


-- Smaller Data Set
CREATE TABLE #tmp2
(
    ID  INT PRIMARY KEY CLUSTERED
)

INSERT INTO #tmp2
-- Purposely insert in reverse order
SELECT TOP 100 PERCENT RN
FROM
(
    SELECT TOP (10000) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) RN
    FROM master..spt_values t1
    CROSS JOIN master..spt_values t2
) x
ORDER BY RN DESC

-- Large Record Set
-- Clustered Key Not Honored*
SELECT TOP 10 *
FROM #tmp

-- Small Record Set
-- Clustered Key Honored
SELECT TOP 10 *
FROM #tmp2

DROP TABLE #tmp
DROP TABLE #tmp2

我没有找到任何表明这是预期行为的参考资料,但在我提交连接项目之前,我首先想联系并确认这不是本地化问题。有人可以指点我识别这是预期行为的文档,或者确认这实际上是一个错误吗?

编辑:为了回应关于不包含ORDER BY子句的评论,我总是假设 TOP 关键字按插入顺序返回数据,在这种情况下,应该是聚集键指定的顺序。对正式表运行相同的语句时,将返回预期的行为:

-- Large Data Set with a Formal Data Table
CREATE TABLE tmp
(
    ID  INT PRIMARY KEY CLUSTERED
)

INSERT INTO tmp
-- Purposely insert in reverse order
SELECT TOP 100 PERCENT RN
FROM
(
    SELECT TOP (10000000) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) RN
    FROM master..spt_values t1
    CROSS JOIN master..spt_values t2
) x
ORDER BY RN DESC

-- Large Record Set
-- Clustered Key Not Honored*
SELECT TOP 10 *
FROM tmp

DROP TABLE tmp

(6325225 row(s) affected)


(1 row(s) affected)
ID
-----------
1
2
3
4
5
6
7
8
9
10

(10 row(s) affected)



(1 row(s) affected)

即使执行计划相同,为什么临时表和正式定义表之间的结果集不同?

最后,向Joe Obbish 大声疾呼,因为我无偿地借鉴了他的 CROSS JOIN 方法来构建大量测试数据,因为它非常高效!

sql-server temporary-tables
  • 2 2 个回答
  • 367 Views

2 个回答

  • Voted
  1. Best Answer
    Martin Smith
    2017-06-23T09:00:33+08:002017-06-23T09:00:33+08:00

    不能保证ORDER没有ORDER BY。

    两者的执行计划都有“Ordered = False”。

    在此处输入图像描述

    这意味着您可能会按关键顺序获得结果,但同样可能不会。

    具体看什么时候可以使用分配顺序扫描?

    只有当数据不可能改变时(例如,当指定了 TABLOCK 提示时,或者当表在只读数据库中时)或者当它明确声明我们不关心时,才会使用这种扫描(例如,指定 NOLOCK 提示时或在 READ UNCOMMITTED 隔离级别下)。作为进一步的转折,分配顺序扫描的设置成本与将要读取的页数之间存在权衡——分配顺序扫描仅在要读取的页面超过 64 时才使用。

    由于其他连接无法访问本地临时表,因此您无需显式获取表锁即可获得此行为,但是关于表大小的注释仍然适用,这就是为什么您会看到两种情况的不同之处。

    如果您需要特定顺序,请添加一个ORDER BY以按键顺序(使用"Ordered = True")进行扫描。

    • 9
  2. Anthony Genovese
    2017-06-23T08:59:13+08:002017-06-23T08:59:13+08:00

    来自 Microsoft - 关于 Top

    当 TOP 与 ORDER BY 子句一起使用时,结果集仅限于前 N 个有序行;否则,它以未定义的顺序返回前 N 行。

    为了获得任何排序,您需要使用order by子句。

    •按指定的列列表对查询的结果集进行排序,并且可以选择将返回的行限制在指定的范围内。除非指定 ORDER BY 子句,否则无法保证结果集中返回行的顺序。

    因此,无论您对表执行什么主键、索引或任何其他操作,获得任何排序的唯一方法是使用 order by 子句。

    • 6

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve