AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 53209
Accepted
Mark D
Mark D
Asked: 2013-11-13 13:37:04 +0800 CST2013-11-13 13:37:04 +0800 CST 2013-11-13 13:37:04 +0800 CST

查找重复项

  • 772

场景如下,前段时间同事不小心跑了一个类似的查询

 DELETE FROM app_i18n WHERE disabled = 0 and translation is null or translation = '';

这是app_i18n的表结构

CREATE TABLE app_i18n (
     `id` INTEGER(11) NOT NULL AUTO_INCREMENT,
     `category` INTEGER(11) unsigned NOT NULL,
     `keyword`  varchar(50) DEFAULT NULL,
     `language` varchar(2) NOT NULL DEFAULT 'en',
     `translation` text NOT NULL,
     `disabled` tinyint(1) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  KEY (`category`, `keyword`, `language`, `disabled`)
) ENGINE=InnoDB;

由此产生的问题是,其中一些“翻译”虽然是空的,但存在是有原因的。所以恢复是为了。从数据库的旧副本中,他恢复了所有为空或空且未禁用的行。

未知数量的其他开发人员迅速投入“翻译”以解决他们遇到的问题,使问题变得更加复杂。所以我认为解决方案是

SELECT id 
  FROM app_i18n 
 WHERE disabled = 0 
   AND (translation is null or translation = '') 
 GROUP BY category, keyword, language 
HAVING COUNT(id) > 1;

该查询会产生我想要的答案吗?即所有具有重复类别的记录,具有重复的相同语言的关键字?

mysql
  • 2 2 个回答
  • 115 Views

2 个回答

  • Voted
  1. Best Answer
    Sebastian Meine
    2013-11-14T09:52:15+08:002013-11-14T09:52:15+08:00

    在大多数 RDBMS 上,您的查询会导致错误。我相信 MySQL 会返回一个结果,但不一定是您要查找的结果。

    当您按一组列分组时,只有在 group by 子句中提到的列也可以直接在 select 子句中提到。所有其他列都必须包含在某种聚合中,如 MAX() 或 AVG()。

    您正在寻找具有重复条目的所有类别、关键字和语言组合。所以你希望你的查询返回这些列:

    SELECT category, keyword, language 
      FROM app_i18n 
     WHERE disabled = 0 
       AND (translation is null or translation = '') 
     GROUP BY category, keyword, language 
    HAVING COUNT(id) > 1;
    

    如果您想要具有非唯一类别、关键字和语言组合的行的所有列,您需要添加一个连接:

    SELECT A.*
      FROM app_i18n A
      JOIN (
           SELECT category, keyword, language 
             FROM app_i18n A2
            WHERE disabled = 0 
              AND (translation is null or translation = '') 
     GROUP BY category, keyword, language 
    HAVING COUNT(id) > 1)C
        ON A.category = C.category
       AND A.keyword = C.keyword
       AND A.language = C.language;
    
    • 1
  2. Raymond Nijland
    2013-11-14T11:41:45+08:002013-11-14T11:41:45+08:00

    MySQL 有一个 GROUP_CONCAT 函数,因此您可以获得与重复记录匹配的逗号分隔的 id 列表。

    SELECT
        GROUP_CONCAT(id ORDER BY id ASC) as "duplicated_row_ids"
      , category
      , keyword
      , language 
      FROM app_i18n 
     WHERE disabled = 0 
       AND (translation is null or translation = '') 
     GROUP BY category, keyword, language 
    HAVING COUNT(id) > 1;
    

    或者

    SELECT
        CONCAT('{"id":'
          , GROUP_CONCAT(CONCAT('"', id, '"') ORDER BY id ASC SEPARATOR ',"id":')
          , '}' 
        ) as "duplicated_row_ids" 
      , category
      , keyword
      , language 
      FROM app_i18n 
     WHERE disabled = 0 
       AND (translation is null or translation = '') 
     GROUP BY category, keyword, language 
    HAVING COUNT(id) > 1;
    

    对于漂亮的 JSON id

    参见http://sqlfiddle.com/#!2/3b51a/6进行演示

    • 0

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    授予用户对所有表的访问权限

    • 5 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve