是否有任何 MySQL 基准测试工具？[关闭]

Question

Lucas Kauffman

Asked: 2012-02-20 03:56:14 +0800 CST2012-02-20 03:56:14 +0800 CST 2012-02-20 03:56:14 +0800 CST

需要找到重复的条目

772

我收到了一个有几百万条记录的数据库，但显然其中可能有重复的记录。

用户向数据库中输入数据并生成主键，但是如果用户再次输入相同的数据，将为该数据生成一个新的主键，即使该数据之前已经输入过。没有对此进行检查。

我需要去寻找这些重复项，但我真的不知道从哪里开始。我首先想到连接子查询中除主键之外的所有单元格，然后计算这些行并查看哪些行的计数高于 1。

比照。

pkey    recipe     fkey    comment
1   toast       3       tasty
2   curry       2       spicy
3   curry       2       spicy
4   bread       1           crumbly
5   orios       2       cookies

这里的 curry 条目是相同的，我必须删除其中的 1 个。

但是我读到在 mysql 中连接是不可预测的，我也觉得有点不对劲。

有什么提示吗？

1 个回答

Voted

RolandoMySQLDBA · Answer 1 · 2012-02-21T16:54:57+08:00

假设您的表名为ingredients. 尝试以下操作：

步骤 01) 创建一个名为的空删除键表ingredients_delete_keys

CREATE TABLE ingredients_delete_keys
SELECT fk,recipe,pkey FROM ingredients WHERE 1=2;

步骤 02) 创建 PRIMARY KEY oningredients_delete_keys

ALTER TABLE ingredients_delete_keys ADD PRIMARY KEY (fk,recipe,pkey);

步骤 03)ingredients用 fk、recipe、pkey 索引表

ALTER TABLE ingredients ADD INDEX fk_recipe_pkey_ndx (fk,recipe,pkey);

步骤 04) 填充ingredients_delete_keys表格

INSERT INTO ingredients_delete_keys
SELECT fk,recipe,MIN(pkey)
FROM ingredients GROUP BY fk,recipe;

步骤 05) 使用不匹配的键对成分表执行 DELETE JOIN

DELETE B.*
FROM ingredients_delete_keys A
LEFT JOIN ingredients B
USING (fk,recipe,pkey)
WHERE B.pkey IS NULL;

步骤 06) 放下删除键

DROP TABLE ingredients_delete_keys;

步骤 07) 去掉fk_recipe_pkey_ndx索引

ALTER TABLE ingredients DROP INDEX fk_recipe_pkey_ndx;

好的，这是一个块中的所有行......

CREATE TABLE ingredients_delete_keys
SELECT fk,recipe,pkey FROM ingredients WHERE 1=2;
ALTER TABLE ingredients_delete_keys ADD PRIMARY KEY (fk,recipe,pkey);
ALTER TABLE ingredients ADD INDEX fk_recipe_pkey_ndx (fk,recipe,pkey);
INSERT INTO ingredients_delete_keys
SELECT fk,recipe,MIN(pkey)
FROM ingredients GROUP BY fk,recipe;
DELETE B.*
FROM ingredients_delete_keys A
LEFT JOIN ingredients B
USING (fk,recipe,pkey)
WHERE B.pkey IS NULL;
DROP TABLE ingredients_delete_keys;
ALTER TABLE ingredients DROP INDEX fk_recipe_pkey_ndx;

试试看！！！

警告

请注意，使用 MIN 函数有助于保留为 fk 输入的第一个 pkey。如果改为将其切换为 MAX 功能，则保留为 fk 输入的最后一个 pkey。

需要找到重复的条目

如何查看 Oracle 中的数据库列表？

mysql innodb_buffer_pool_size 应该有多大？

列出指定表的所有列

从 .frm 和 .ibd 文件恢复表？

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

如何选择每组的第一行？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

需要找到重复的条目

1 个回答

相关问题