是否有任何 MySQL 基准测试工具？[关闭]

Question

Asked: 2024-02-16 18:18:26 +0800 CST2024-02-16 18:18:26 +0800 CST 2024-02-16 18:18:26 +0800 CST

表列中的单词及其出现次数

772

我有一个列（varchar），其中包含用“-”分隔的单词。

表示例：

ID	蛞蝓
1	姓名1-姓名2-姓名3-姓名4-姓名5
2	姓名6-姓名2-姓名3-姓名4-姓名7

计算单词及其出现次数的最佳方法是什么？

预期结果：

单词	数数
姓名1	1
姓名2	2
姓名3	2
姓名4	2
姓名5	1
姓名6	1
姓名7	1

我尝试了这个查询，它在包含超过 22 万条记录的表上运行速度很快，但不确定这是否正确（计数正确与否）

  SELECT 
  SUBSTRING_INDEX(slug,'-',-1) AS word,
  count(SUBSTRING_INDEX(slug,'-',-1)) as count 
  FROM table_name
  GROUP BY word

2 个回答

Voted

Akina · Answer 1 · 2024-02-16T20:59:21+08:00

CREATE TABLE test (id INT,  slug VARCHAR(100));
INSERT INTO test VALUES
(1, 'name1-name2-name3-name4-name5'),
(2, 'name6-name2-name3-name4-name7');

SELECT jsontable.word, COUNT(*) amount
FROM test
CROSS JOIN JSON_TABLE(
    CONCAT('["', REPLACE(test.slug, '-', '","'), '"]'),
           '$[*]' COLUMNS (word VARCHAR(16) PATH '$')) jsontable
GROUP BY jsontable.word;

单词	数量
姓名1	1
姓名2	2
姓名3	2
姓名4	2
姓名5	1
姓名6	1
姓名7	1

小提琴

Phill W. · Answer 2 · 2024-02-16T20:14:04+08:00

“最好”的方法是正确标准化您的数据。

select * 
from table1 ; 

+----+-------+
| id | name  | 
+----+-------+
|  1 | name1 |
|  1 | name2 |
|  1 | name3 |
|  1 | name4 |
|  1 | name5 |
|  2 | name6 |
|  2 | name2 |
|  2 | name3 |
|  2 | name4 |
|  2 | name7 |
+----+-------+

然后，您的要求变成一个简单的“分组依据”查询：

select 
  name
, count( * ) tally 
from table1 
group by name 
order by name ; 

+-------+-------+
| name  | tally | 
+-------+-------+
| name1 |     1 |
| name2 |     2 |
| name3 |     2 |
| name4 |     2 |
| name5 |     1 |
| name6 |     1 |
| name7 |     1 |
+-------+-------+

表列中的单词及其出现次数

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

表列中的单词及其出现次数

2 个回答

相关问题