是否有任何 MySQL 基准测试工具？[关闭]

Question

Nico

Asked: 2024-01-23 04:04:28 +0800 CST2024-01-23 04:04:28 +0800 CST 2024-01-23 04:04:28 +0800 CST

高流量期间，select count(*) 在 RDS/MySQL 中花费太多时间

772

设置：

db.t3.xlargeRDS 实例。
MySQL 8.0.33 引擎。
默认参数和选项组。
~900k 记录表。
RDS 根本没有启用日志记录，我们现在无法重新启动实例来启用它。

该数据库连接到在 Lambda 中运行的 Laravel 应用程序。lambda 中的过程之一需要计算表中的行数spin。

在第一次迭代期间，我们发现select count()以下面的方式编写的内容有时会花费大量的秒数。有些请求是立即发出的，而另一些请求可能需要 20 秒以上。

select count(*) from spin;

我们在互联网上挖掘了一些抱怨此事的人的答案。我们决定向查询添加一个条件，这使其成为亚秒级查询：

select count(*) from spin where id > 0;

直到几天前，我们的服务开始收到比平时更多的流量，并且查询运行时间变得非常跳跃。

+--------+-------+------------------+---------+---------+------+-----------+----------------------------------------------------------+
| ID     | USER  | HOST             | DB      | COMMAND | TIME | STATE     | INFO                                                     |
+--------+-------+------------------+---------+---------+------+-----------+----------------------------------------------------------+
| 114168 | vmx   | 10.0.2.175:43169 | fdata   | Execute |   60 | executing | select count(*) as aggregate from `spin` where `id` > 0  |
| 114171 | vmx   | 10.0.3.149:31136 | fdata   | Execute |   58 | executing | select count(*) as aggregate from `spin` where `id` > 0  |
| 114118 | vmx   | 10.0.2.175:36571 | fdata   | Execute |  109 | executing | select count(*) as aggregate from `spin` where `id` > 0  |
+--------+-------+------------------+---------+---------+------+-----------+----------------------------------------------------------+

我怀疑这一定是由于对表的某些访问锁定造成的spin。在表锁定期间，select count()挂起。

任何意见表示赞赏，谢谢。

3 个回答

Voted

J.D. · Answer 1 · 2024-01-23T12:39:44+08:00

任何意见都会受到赞赏

为什么要在近百万行的表中实时查询整个表的计数？这听起来有点武断——谁会注意到或关心这一秒的确切计数是 957,432，几分钟后现在是 957,433？

我至少建议缓存该计数，然后从缓存中读取重复命中。

S.D. · Answer 2 · 2024-01-23T14:40:01+08:00

不确定您如何在应用程序中利用这些计数，但您可以查询INFORMATION_SCHEMA以获得近似计数，它们会随着表统计信息的更新而更新，应该接近实际的行计数。

SELECT TABLE_ROWS 
FROM INFORMATION_SCHEMA.TABLES 
WHERE TABLE_NAME = 'spin'
AND TABLE_SCHEMA = 'schema_name'

Rick James · Answer 3 · 2024-01-23T14:47:02+08:00

原因是其他连接有时会以与 COUNT 冲突的方式接触该表。或者至少让它陷入困境。

我同意 JD 的观点，即寻找计数可能是不必要的。我同意 SD 的说法，你可以得到一个估计；然而，这一估计可能相差甚远。

请解释您的计数用途；也许我们可以定制一些技巧来帮助你。

一个技巧是有一个辅助列INDEX(foo)，其中foo是表中最小的列之一。`COUNT(*) 将使用该 BTree 进行计数。这可能会跑得更快，并且可能会更少遇到减速带。

高流量期间，select count(*) 在 RDS/MySQL 中花费太多时间

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

高流量期间，select count(*) 在 RDS/MySQL 中花费太多时间

3 个回答

相关问题