AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 5131
Accepted
Mark D
Mark D
Asked: 2011-08-28 18:26:54 +0800 CST2011-08-28 18:26:54 +0800 CST 2011-08-28 18:26:54 +0800 CST

检查是否真的需要 DISTINCT

  • 772

我在 mysql 中有一个查询如下。

SELECT DISTINCT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
ORDER BY `tableA`.`ColA` DESC `tableB`.`ColA` ASC
LIMIT 0,20

由于各个表的大小,现在执行查询大约需要 13 秒。但是这个查询要快得多(即 2 秒)

SELECT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
FROM `tableA`
LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
WHERE <whereconditions>
ORDER BY `tableA`.`ColA` DESC `tableB`.`ColA` ASC
LIMIT 0,20

我知道这可能会导致行不清晰,但我不确定前端的 php 代码是否已经解决了这种情况。所以我其实是想比较两个结果集的数据,如果不限制的话,这两个结果集的结果都是大约83000行。

任何人都可以想出一种在 SQL 中执行此操作而不是通过 php 脚本执行此操作的方法。我已经用肉眼比较了前 100 行,没有任何问题,但众所周知,只有在第 101 行有一个例外才会把一切都搞砸。所以我需要一个我可以经常执行几次的查询,以查看一个结果集中是否有行不在另一个结果集中。

mysql
  • 5 5 个回答
  • 753 Views

5 个回答

  • Voted
  1. Best Answer
    Dave Rix
    2011-08-29T14:33:45+08:002011-08-29T14:33:45+08:00

    好的,首先,与 PHP 开发人员交谈,看看是否为您解决了这种情况,这样可以避免很多痛苦和心痛!

    除此之外,尝试使用 group by 而不是 distinct,看看性能差异是什么 - 根据表上的索引,group by 可能更快。

    使用 GROUP BY 选项,您可以添加一个计数 (*),然后与 php 开发人员交谈,以确保他们知道如果该结果为 2 或更多,那么他们需要以不同于结果为 1 的方式处理它。

    • 5
  2. GrumpyMonkey
    2011-08-29T03:14:34+08:002011-08-29T03:14:34+08:00

    您是否尝试过将 order by 替换为 group by 然后使用 count(*) > 1 语句。那应该显示是否有重复的行

    • 4
  3. Derek Kromm
    2011-08-28T18:39:46+08:002011-08-28T18:39:46+08:00

    从每个查询中选择计数并进行比较?

    select count(*) from (
    SELECT DISTINCT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
    FROM `tableA`
    LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
    WHERE <whereconditions>
    ) a
    
    select count(*) from (
    SELECT `tableA`.`ColA`, `tableA`.`ColB`, `tableB`.`ColA`, ...
    FROM `tableA`
    LEFT JOIN `tableB` ON `tableA`.`colC` = `tableB`.`colA`
    WHERE <whereconditions>
    ) a
    
    • 3
  4. drex
    2011-08-30T16:01:27+08:002011-08-30T16:01:27+08:00

    您可以将 ORDER BY 放入单独的查询中,然后使用 INNER JOIN 获取所需的其余列。

    SELECT columns_needed FROM table1
    INNER JOIN (
        SELECT DISTINCT t1.column_to_distinct, t1.primary_key, t1.colA, t2.colA
        FROM table1 t1
        LEFT JOIN table2 ON t1.colC = t2.colA
        WHERE <whereconditions>
        ORDER BY t1.colA DESC t2.a ASC
        LIMIT 0,20
    ) 
    as sub1 ON sub1.primary_key = table1.primary_key
    LEFT JOIN .....
    

    还要在 table1 中的 (column_to_distinct,primary_key, colA) 和 table2 中的 colA 上放置一个索引,以允许 MySQL 进行索引扫描。

    将 ORDER BY 放在 INNER JOIN 中允许 MySQL 更快地执行排序,因为要排序的列更少。

    • 1
  5. Razvan Popovici
    2011-08-30T11:04:54+08:002011-08-30T11:04:54+08:00

    你需要一个关于 的索引tableB。colA

    此外,它更有效率

    ORDER BY `tableA`.`ColA` DESC `tableA`.`ColC` ASC
    

    (因为tableA.与.ColC 相同)和 tableA 中 ColA、ColC 的索引。tableBColA

    你的两个查询之间的差异不应该很大,只要你继续选择少量文章(在你的例子中是 20 篇)并且你从头开始(我假设你有页面)。

    另一个建议是尝试在 tableB 上建立索引,并在 distinct 子句中选择所有列。

    只要您使用页面(不同记录 1-20、不同记录 21-40 等),在客户端中实施“不同”子句就非常困难。程序会变得不必要的复杂。

    • 0

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve