AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 45407
Accepted
Arash Mousavi
Arash Mousavi
Asked: 2013-06-29 01:56:34 +0800 CST2013-06-29 01:56:34 +0800 CST 2013-06-29 01:56:34 +0800 CST

更改 ORDER BY 方向会导致性能问题

  • 772

我使用 MySQL 5.6,我有两个表,每个表有 1600 万行:

CREATE TABLE IF NOT EXISTS `newsstudios` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `title` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci AUTO_INCREMENT=16855382 ;

CREATE TABLE IF NOT EXISTS `newsstudio_categories` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `newsstudio_id` int(11) NOT NULL,
  `category_id` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `newsstudio_id` (`newsstudio_id`),
  KEY `category_id` (`category_id`),
  KEY `newsstudio_id_category_id` (`newsstudio_id`,`category_id`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci AUTO_INCREMENT=16864013 ;

我有一个订单查询order by newsstudios.id ASC:

SELECT SQL_NO_CACHE id FROM `newsstudios` WHERE exists 
(
  select newsstudio_id from newsstudio_categories 
  where newsstudios.id=newsstudio_categories.newsstudio_id 
  and newsstudio_categories.category_id in (1303,1313,1323,1333,1343,632)
) 
order by newsstudios.id limit 5;

此查询的结果是:

+------+
| id   |
+------+
|   27 |
|   47 |
|   87 |
|  110 |
|  181 |
+------+
5 rows in set (0.19 sec)

但是当我将 order by 的方向更改为DESC查询执行时间时减少了 100 倍:

+------+
| id   |
+------+
| 98232|
| 98111|
| 95222|
| 88132|
| 78181|
+------+
5 rows in set (21 sec)

第一:为什么这种排序方向的改变会导致性能上的巨大差异?

第二:在此查询之前,我尝试过LEFT JOIN查询WHERE IN而不是查询,WHERE EXISTS但它们有重复的结果,我应该使用GROUP BY它导致的结果using filesort,这会using temporary大大降低性能。您对查询有更好的性能有什么建议吗?

mysql performance
  • 2 2 个回答
  • 381 Views

2 个回答

  • Voted
  1. Best Answer
    ypercubeᵀᴹ
    2013-06-29T05:58:43+08:002013-06-29T05:58:43+08:00

    如果您要搜索的不同类别不是很多,并且您可以构建更复杂的查询,这将使用索引(category_id, newsstudio_id),我希望它比您之前的查询更有效,无论是选择ASC还是DESC选择。

    构造起来有点复杂,如果类别数量为数十或数百,我预计效率会降低:

    SELECT newsstudio_id
    FROM 
      ( ( SELECT newsstudio_id  FROM newsstudio_categories  WHERE category_id = 1303
          ORDER BY newsstudio_id DESC  LIMIT 5 
        ) 
        UNION 
        ( SELECT newsstudio_id  FROM newsstudio_categories  WHERE category_id = 1313
          ORDER BY newsstudio_id DESC  LIMIT 5 
        )
          ...
        UNION
        ( SELECT newsstudio_id  FROM newsstudio_categories  WHERE category_id = 632
          ORDER BY newsstudio_id DESC  LIMIT 5 
        )
      ) AS tmp
    ORDER BY newsstudio_id DESC
    LIMIT 5 ;
    
    • 4
  2. Andrew G
    2013-06-29T04:06:49+08:002013-06-29T04:06:49+08:00

    正如 ypercube 在他的评论中所说,如果字段被反转,你的索引在这种情况下应该表现得更好。

    此外,只要每个newsstudio_categories. newsstudio_id在 中至少有一个匹配行newsstudios。id(您的模式不能保证,但似乎有可能),那么您可以通过只查看的查询来解决newsstudio_categories

    SELECT SQL_NO_CACHE DISTINCT `newsstudio_id` AS id FROM
    newsstudio_categories
    WHERE newsstudio_categories.category_id in (1303 , 1313, 1323, 1333, 1343, 632)
    ORDER BY `newsstudio_id` DESC
    LIMIT 5
    

    或者

    SELECT SQL_NO_CACHE `newsstudio_id` AS id FROM
    newsstudio_categories
    WHERE newsstudio_categories.category_id in (1303 , 1313, 1323, 1333, 1343, 632)
    GROUP BY `newsstudio_id`
    ORDER BY `newsstudio_id` DESC
    LIMIT 5
    
    • 2

相关问题

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    授予用户对所有表的访问权限

    • 5 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve