是否有任何 MySQL 基准测试工具？[关闭]

Question

Mark D

Asked: 2011-08-28 18:26:54 +0800 CST2011-08-28 18:26:54 +0800 CST 2011-08-28 18:26:54 +0800 CST

检查是否真的需要 DISTINCT

772

我在 mysql 中有一个查询如下。

SELECT DISTINCT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
ORDER BY `tableA`.`ColA` DESC `tableB`.`ColA` ASC
LIMIT 0,20

由于各个表的大小，现在执行查询大约需要 13 秒。但是这个查询要快得多（即 2 秒）

SELECT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
ORDER BY `tableA`.`ColA` DESC `tableB`.`ColA` ASC
LIMIT 0,20

我知道这可能会导致行不清晰，但我不确定前端的 php 代码是否已经解决了这种情况。所以我其实是想比较两个结果集的数据，如果不限制的话，这两个结果集的结果都是大约83000行。

任何人都可以想出一种在 SQL 中执行此操作而不是通过 php 脚本执行此操作的方法。我已经用肉眼比较了前 100 行，没有任何问题，但众所周知，只有在第 101 行有一个例外才会把一切都搞砸。所以我需要一个我可以经常执行几次的查询，以查看一个结果集中是否有行不在另一个结果集中。

5 个回答

Voted

Dave Rix · Answer 1 · 2011-08-29T14:33:45+08:00

Best Answer

Dave Rix

2011-08-29T14:33:45+08:002011-08-29T14:33:45+08:00

好的，首先，与 PHP 开发人员交谈，看看是否为您解决了这种情况，这样可以避免很多痛苦和心痛！

除此之外，尝试使用 group by 而不是 distinct，看看性能差异是什么 - 根据表上的索引，group by 可能更快。

使用 GROUP BY 选项，您可以添加一个计数 (*)，然后与 php 开发人员交谈，以确保他们知道如果该结果为 2 或更多，那么他们需要以不同于结果为 1 的方式处理它。

5

GrumpyMonkey · Answer 2 · 2011-08-29T03:14:34+08:00

GrumpyMonkey

2011-08-29T03:14:34+08:002011-08-29T03:14:34+08:00

您是否尝试过将 order by 替换为 group by 然后使用 count(*) > 1 语句。那应该显示是否有重复的行

4

Derek Kromm · Answer 3 · 2011-08-28T18:39:46+08:00

Derek Kromm

2011-08-28T18:39:46+08:002011-08-28T18:39:46+08:00

从每个查询中选择计数并进行比较？

select count(*) from (
SELECT DISTINCT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
) a

select count(*) from (
SELECT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
) a

3

drex · Answer 4 · 2011-08-30T16:01:27+08:00

drex

2011-08-30T16:01:27+08:002011-08-30T16:01:27+08:00

您可以将 ORDER BY 放入单独的查询中，然后使用 INNER JOIN 获取所需的其余列。

SELECT columns_needed FROM table1
INNER JOIN (
    SELECT DISTINCT t1.column_to_distinct, t1.primary_key, t1.colA, t2.colA
    FROM table1 t1
    LEFT JOIN table2 ON t1.colC = t2.colA
    WHERE <whereconditions>
    ORDER BY t1.colA DESC t2.a ASC
    LIMIT 0,20
) 
as sub1 ON sub1.primary_key = table1.primary_key
LEFT JOIN .....

还要在 table1 中的 (column_to_distinct,primary_key, colA) 和 table2 中的 colA 上放置一个索引，以允许 MySQL 进行索引扫描。

将 ORDER BY 放在 INNER JOIN 中允许 MySQL 更快地执行排序，因为要排序的列更少。

1

Razvan Popovici · Answer 5 · 2011-08-30T11:04:54+08:00

Razvan Popovici

2011-08-30T11:04:54+08:002011-08-30T11:04:54+08:00

你需要一个关于的索引tableB。colA

此外，它更有效率

ORDER BY `tableA`.`ColA` DESC `tableA`.`ColC` ASC

（因为tableA.与.ColC 相同）和 tableA 中 ColA、ColC 的索引。tableBColA

你的两个查询之间的差异不应该很大，只要你继续选择少量文章（在你的例子中是 20 篇）并且你从头开始（我假设你有页面）。

另一个建议是尝试在 tableB 上建立索引，并在 distinct 子句中选择所有列。

只要您使用页面（不同记录 1-20、不同记录 21-40 等），在客户端中实施“不同”子句就非常困难。程序会变得不必要的复杂。

0

检查是否真的需要 DISTINCT

你如何mysqldump特定的表？

您如何显示在 Oracle 数据库上执行的 SQL？

如何选择每组的第一行？

使用 psql 列出数据库权限

我可以查看在 SQL Server 数据库上运行的历史查询吗？

如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id？

如何在 Mac OS X 上运行 psql？

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

将数组参数传递给存储过程

检查是否真的需要 DISTINCT

5 个回答

相关问题