是否有任何 MySQL 基准测试工具？[关闭]

Question

Asked: 2023-09-11 00:36:20 +0800 CST2023-09-11 00:36:20 +0800 CST 2023-09-11 00:36:20 +0800 CST

优化MySQL（InnoDB）中的插入操作

772

我有这张表：

create table tab3(
id                              int not null auto_increment,
phrase                          text,
link_1                          int,
link_2                          int,
primary key (id),
foreign key (link_1) references tab1 (id),
foreign key (link_2) references tab2 (id));

我使用 Python 将大约 400k 行插入到该表中。这是插入语句：

INSERT INTO tab3(phrase, link_1, link_2)
    VALUES(
        %s,
        (select id from tab1 where tab1.col1 = %s),
        (select id from tab2 where tab2.col2 = %s));

我在表 tab1.col1 和 tab2.col2 上都有索引。但插入需要很长时间，大约 5 分钟/1000 行

我尝试了MySQL 官方文档中的许多不同技术，例如：

使用cursor.execute(stmt,param)
使用cursor.executemany(stmt, param s )
多个进程（台球https://pypi.org/project/billiard/）
阻塞提交，直到插入所有数据块，然后提交更改
将插入 stmt 封装在一个事务中（使用START TRANSACTION）

但以上都没有给出很好的改进。

danblack · Answer 1 · 2023-09-11T12:33:16+08:00

使用 MariaDB ，MariaDB-10.7+对批量插入进行了内置改进。

这适用于foreign_key_checks=0和时的空表unique_checks=0。

一般来说，无论版本如何，请考虑增加innodb-buffer-pool-size以覆盖tab3创建的信息和正在读取的tab1/tab2数据，以便大部分数据都在内存中。

早期版本可能会受益于增加的innodb-log-file-size.

还要看看你的phase. 如果它包含少量文本，则 avarchar(max num of characters)是更好的存储类型，因为它避免了一些 innodb 批量大小处理代码，这些代码会进行一些大小/速度权衡。

优化MySQL（InnoDB）中的插入操作

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

优化MySQL（InnoDB）中的插入操作

1 个回答

相关问题