AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 301377
Accepted
Sranda
Sranda
Asked: 2021-10-20 21:59:21 +0800 CST2021-10-20 21:59:21 +0800 CST 2021-10-20 21:59:21 +0800 CST

减少数据库引擎为此聚合查询读取的行数

  • 772

我想调整这个查询 - 它正在读取比我想要的更多的行。我已按照 Database Tuning Advisor 的建议添加了一个索引。

查询是这样的:

SET STATISTICS TIME, IO ON;

SELECT TOP 1000 project,
    Max(timestamp) timestamp
FROM   the_table
WHERE  deviceid = 581
GROUP  BY project

IO ,时间统计是这样的:

Table 'the_table'. Scan count 1, logical reads 2373, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

(1 row affected)

 SQL Server Execution Times:
   CPU time = 390 ms,  elapsed time = 829 ms.
SQL Server parse and compile time: 
   CPU time = 0 ms, elapsed time = 0 ms.

执行计划可以在这里找到。

此查询查找的 dta_index 由projectnumber和组成timestamp。该表大约有 4,500,000 行,消耗大约 350MB,每条deviceid记录的数量大致相同(即均匀分布,每个设备大约有 700K 条记录)。

我的问题:即使我只请求表中的前 1,000 行,无论我创建了什么索引或如何尝试重新编写查询,我总是最终读取 +/- 700K 行(即所有WHERE子句中所选设备的行)。如果您能放弃有关如何调整此查询的提示,我将不胜感激。

我不认为有比接触大约 700K 行更快的方法来缩小这个查询,特别是deviceid使用 exec 的第一个运算符。计划。

这是一个最小的可重现示例,包括表定义和两个示例行的插入:

CREATE TABLE [dbo].[the_table]
(
    [primary_key_col] [int] IDENTITY(1,1) NOT NULL,
    [Project] [int] NULL,
    [DeviceID] [int] NULL,
    [TimeStamp] [datetime] NULL,
    [Quantity] [int] NOT NULL,
    PRIMARY KEY CLUSTERED 
    (
        [primary_key_col] ASC
    ) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY];

SET IDENTITY_INSERT [dbo].[the_table] ON;
INSERT [dbo].[the_table] ([primary_key_col], [Project], [DeviceID], [TimeStamp], [Quantity]) VALUES (4825107, 1232, 587, CAST(N'2021-10-23T05:48:48.000' AS DateTime), 1);
INSERT [dbo].[the_table]  ([primary_key_col], [Project], [DeviceID], [TimeStamp], [Quantity])  VALUES (4825108, 6458, 581, CAST(N'2021-10-23T05:49:17.000' AS DateTime), 1);
primary_key_col 项目 设备ID 时间戳 数量
4825107 1232 587 2021-10-23 05:48:48.000 1
4825108 6458 581 2021-10-23 05:49:17.000 1

索引不是故意的问题的一部分,无论我尝试了哪个索引,对于特定的 deviceID,我总是达到 700K 行。

谢谢。

sql-server query-performance
  • 2 2 个回答
  • 156 Views

2 个回答

  • Voted
  1. Best Answer
    Andrew Sayer
    2021-10-20T22:27:47+08:002021-10-20T22:27:47+08:00

    “我的问题:即使我只读取表中的前 1000 行”你不是。您正在阅读分组查询的前 1000 个结果(没有任何排序) -top 1000在处理顺序中排在最后。

    如果您想获取与deviceid谓词匹配的“随机”1000 行,则可以使用子查询:

    select project, max(timestamp) timestamp
    from (select top 1000
                 project, timestamp
          from   the_table
          where  deviceid = 581
         ) sq
    group by project
    
    • 4
  2. Mainecoon21
    2021-10-20T22:28:36+08:002021-10-20T22:28:36+08:00

    抱歉,但从我的角度来看,您应该重新考虑您的查询逻辑,因为它会获取所有匹配的行deviceid并从匹配的行中获取前 1000 个,而不是从表中获取前 1000 个。你也可以在你的执行计划中看到它:右侧是一个表查找deviceid,TOP 是左侧的最后一个运算符。这就是你得到这么多行的原因。

    • 0

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve