AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 10257
Accepted
Ran
Ran
Asked: 2012-01-07 01:35:44 +0800 CST2012-01-07 01:35:44 +0800 CST 2012-01-07 01:35:44 +0800 CST

MySql - 我怎样才能加快这个查询

  • 772

我有以下表格:

CREATE TABLE `users` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `first_name` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `last_name` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `account_data` text COLLATE utf8_unicode_ci,
  `created_at` datetime DEFAULT NULL,
  `updated_at` datetime DEFAULT NULL,
  `twitter_username` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `email` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `crypted_password` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `password_salt` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `persistence_token` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `single_access_token` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `perishable_token` varchar(255) COLLATE utf8_unicode_ci NOT NULL,
  `login_count` int(11) NOT NULL DEFAULT '0',
  `failed_login_count` int(11) NOT NULL DEFAULT '0',
  `last_request_at` datetime DEFAULT NULL,
  `current_login_at` datetime DEFAULT NULL,
  `last_login_at` datetime DEFAULT NULL,
  `current_login_ip` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `last_login_ip` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `is_admin` tinyint(1) DEFAULT '0',
  `referrer_id` int(11) DEFAULT NULL,
  `partner` tinyint(1) DEFAULT '0',
  `subscription_type` varchar(255) COLLATE utf8_unicode_ci DEFAULT 'free',
  `workflow_state` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `persona_id` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `persona_index` (`persona_id`)
) ENGINE=InnoDB 

和表格:

CREATE TABLE `user_actions` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `user_id` int(11) DEFAULT NULL,
  `action_type` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `module` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL,
  `data` text COLLATE utf8_unicode_ci,
  `timestamp` datetime DEFAULT NULL,
  `created_at` datetime DEFAULT NULL,
  `updated_at` datetime DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `user_id_index` (`user_id`),
  KEY `action_type_index` (`action_type`),
  KEY `user_action_type_index` (`user_id`,`action_type`),
  KEY `timestamp_index` (`timestamp`),
  KEY `user_id_timestamp_index` (`user_id`,`timestamp`)
) ENGINE=InnoDB 

问题在于以下查询:

    SELECT user_actions.*, users.twitter_username, users.email FROM `user_actions` 
INNER JOIN users ON (user_actions.user_id=users.id) ORDER BY timestamp DESC LIMIT 0, 30

这是解释:

user_actions    
The table was retrieved with this index: user_id_timestamp_index
You can speed up this query by querying only fields that are within the index. Or you can create an index that includes every field in your query, including the primary key.
Approximately 76 rows of this table were scanned.
users   
This table was retrieved with a full table scan, which is often quite bad for performance, unless you only retrieve a few rows.
The table was retrieved with this index:
No index was used in this part of the query.
A temporary table was created to access this part of the query, which can cause poor performance. This typically happens if the query contains GROUP BY and ORDER BY clauses that list columns differently.
MySQL had to do an extra pass to retrieve the rows in sorted order, which is a cause of poor performance but sometimes unavoidable.
You can speed up this query by querying only fields that are within the index. Or you can create an index that includes every field in your query, including the primary key.
Approximately 3445 rows of this table were scanned.

这个查询需要很长时间才能执行,有什么想法可以改进吗?

mysql query
  • 2 2 个回答
  • 5201 Views

2 个回答

  • Voted
  1. Best Answer
    RolandoMySQLDBA
    2012-01-07T09:03:55+08:002012-01-07T09:03:55+08:00

    这是您的原始查询:

    SELECT
        user_actions.*,
        users.twitter_username,
        users.email
    FROM
        `user_actions`  
        INNER JOIN users
        ON (user_actions.user_id=users.id)
        ORDER BY timestamp
        DESC LIMIT 0, 30
    ;
    

    我注意到的第一件事是您要加入两个完整的表。由于您只需要twitter_username和email来自users表,因此您应该只users使用三列连接id:twitter_username和email。

    第二件事是LIMIT条款。它在加入后执行。您应该在加入之前执行它。在您的情况下,您请求 30 个最近的用户操作。如果您可以保证从 中仅检索 30 行user_actions,则连接应该运行得更快。

    如果您从 @DTest 阅读答案,他的前两个要点已经告诉您查询出了什么问题,因为 mysql 在从每个表中收集数据时将采取的操作。关键是要了解在处理查询时临时表的外观以及数据将驻留的位置(内存或磁盘)。

    您需要做的是重构查询以欺骗 MySQL 查询优化器。强制查询生成较小的临时表。在大多数情况下,my.cnf 中的配置更改应该会产生巨大的影响。在其他情况下,例如这种情况,重构查询可能就足够了。

    这是我对您的查询的建议更改,它应该可以更快地工作:

    SELECT
        ua.*,
        u.twitter_username,
        u.email
    FROM
        (SELECT * FROM `user_actions`
        ORDER BY timestamp DESC LIMIT 30) ua
        LEFT JOIN
        (SELECT id,twitter_username,email FROM `users`) u
        ON (ua.user_id=u.id)
    ;
    

    以下是重构查询的原因:

    原因 #1

    如果您查看内联表ua,我只使用LIMIT. 无论桌子有多大,都会发生这种情况user_actions。它已经被订购,因为ORDER BY timestamp DESC发生在LIMIT.

    原因 #2

    如果你看一下内联表u,它有id, twitter_username, email. id是实现连接所必需的。

    原因 #3

    我使用LEFT JOIN而不是INNER JOIN出于两(2)个原因:

    1. 保留基于查询的顺序ua
    2. 如果表中的 user_idua不再存在,则显示所有用户操作users。

    做这些事情会迫使临时表变小。尽管如此,您仍然需要从@DTest 的回答中实施要点#3,以抢占临时表在磁盘上的位置。

    • 5
  2. Derek Downey
    2012-01-07T08:00:23+08:002012-01-07T08:00:23+08:00

    那么主要问题是,由于您的查询没有任何过滤(没有WHERE语句),它将所有带有列的行user_actions.*, twitter_username, email放入一个临时表中进行排序。

    所以我要做的第一件事是尝试限制进入结果集中的行数。例如,我会说添加 aWHERE timestamp > DATE_SUB(NOW(), INTERVAL 7 DAY)以仅在过去 7 天内获得结果(如果您的用例可以接受)。

    接下来,我将更改查询以仅从中提取所需的列,user_actions以减少放入临时表所需的信息量。

    现在您可能已经删除了也可能没有删除需要放在临时表中进行排序的行/列,让我们看看 MySQL 如何处理临时表。从关于tmp_table_size变量的文档(强调添加):

    内部内存临时表的最大大小。(实际限制为 tmp_table_size 和 max_heap_table_size 的最小值。)1 如果内存中的临时表超过限制,MySQL 会自动将其转换为磁盘上的 MyISAM 表。

    首先,让我指出上标1表示的警告:在内存中创建的临时表的大小是tmp_table_size或的最小值max_heap_table_size,因此如果增加一个,请务必增加另一个。

    如果您的数据量超过这两个变量中最小值的大小,它将被放置在磁盘上。磁盘很慢。如果可以避免,请不要做磁盘!

    回顾一下:

    • 使用 .限制要排序的行数WHERE。即使您正在执行LIMIT,所有行仍被放置在临时表中进行排序。

    • 限制您请求的列数。如果您不需要它们,请不要索取它们。

    • 最后的手段,如果查询正在增加您的状态变量,请增加tmp_table_size其max_heap_table_size大小Created_tmp_disk_tables。另外,不要大幅增加。它可能会对性能产生影响,具体取决于您的硬件和服务器上的 RAM 量。

    • 3

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何查看 Oracle 中的数据库列表?

    • 8 个回答
  • Marko Smith

    mysql innodb_buffer_pool_size 应该有多大?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    从 .frm 和 .ibd 文件恢复表?

    • 10 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve