AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 341545
Accepted
tuespetre
tuespetre
Asked: 2024-08-10 00:29:18 +0800 CST2024-08-10 00:29:18 +0800 CST 2024-08-10 00:29:18 +0800 CST

如何让 MySQL 对窗口函数使用合适的索引而不是文件排序?

  • 772

我正在使用 MySQL 版本8.0.38。

给出下表:

CREATE TABLE `url_alias` (
    `pid` INT UNSIGNED NOT NULL AUTO_INCREMENT,
    `src` VARCHAR(128) NOT NULL DEFAULT '' COLLATE 'utf8mb3_general_ci',
    `dst` VARCHAR(128) NOT NULL DEFAULT '' COLLATE 'utf8mb3_general_ci',
    PRIMARY KEY (`pid`) USING BTREE,
    INDEX `src_dst_pid` (`src`, `dst`, `pid` DESC) USING BTREE
)
COLLATE='utf8mb3_general_ci'
ENGINE=InnoDB
;

对该表进行以下查询:

SELECT *
FROM (
    SELECT ua.pid, ua.src, ua.dst, ROW_NUMBER() OVER w AS 'num'
    FROM url_alias ua
    WINDOW w AS (
        PARTITION BY ua.src, ua.dst 
        ORDER BY ua.pid DESC
    )
) t
WHERE t.num > 1

使用EXPLAIN FORMAT=JSON,我得到以下信息:

{
  "query_block": {
    "select_id": 1,
    "cost_info": {
      "query_cost": "85537.71"
    },
    "table": {
      "table_name": "t",
      "access_type": "ALL",
      "rows_examined_per_scan": 760313,
      "rows_produced_per_join": 253412,
      "filtered": "33.33",
      "cost_info": {
        "read_cost": "60196.48",
        "eval_cost": "25341.23",
        "prefix_cost": "85537.71",
        "data_read_per_join": "191M"
      },
      "used_columns": [
        "pid",
        "src",
        "dst",
        "num"
      ],
      "attached_condition": "(`t`.`num` > 1)",
      "materialized_from_subquery": {
        "using_temporary_table": true,
        "dependent": false,
        "cacheable": true,
        "query_block": {
          "select_id": 2,
          "cost_info": {
            "query_cost": "838338.80"
          },
          "windowing": {
            "windows": [
              {
                "name": "w",
                "using_filesort": true,
                "filesort_key": [
                  "`src`",
                  "`dst`",
                  "`pid` desc"
                ],
                "functions": [
                  "row_number"
                ]
              }
            ],
            "cost_info": {
              "sort_cost": "760313.00"
            },
            "table": {
              "table_name": "ua",
              "access_type": "index",
              "key": "src_dst_pid",
              "used_key_parts": [
                "src",
                "dst",
                "pid"
              ],
              "key_length": "776",
              "rows_examined_per_scan": 760313,
              "rows_produced_per_join": 760313,
              "filtered": "100.00",
              "using_index": true,
              "cost_info": {
                "read_cost": "1994.50",
                "eval_cost": "76031.30",
                "prefix_cost": "78025.80",
                "data_read_per_join": "568M"
              },
              "used_columns": [
                "pid",
                "src",
                "dst"
              ]
            }
          }
        }
      }
    }
  }
}

这表明查询中指定的窗口正在导致文件排序,即使ROW_NUMBER() OVER (PARTITION BY src, dst ORDER BY pid DESC)应该等同于在src_dst_pid维护某些计数器变量的同时按顺序读取索引。

有什么可以做的事情来消除查询中的文件排序,或者这是查询规划器的一些限制?

mysql
  • 1 1 个回答
  • 23 Views

1 个回答

  • Voted
  1. Best Answer
    tuespetre
    2024-08-10T00:41:23+08:002024-08-10T00:41:23+08:00

    这似乎是 MySQL 的一个限制,正如 MySQL 团队在以下错误报告中所指出的那样:

    这实际上是去年讨论过的一个问题,结论是,在当前的基础设施下,这种优化是不可能的。

    https://bugs.mysql.com/bug.php?id=110999

    • 1

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve