我应该从 RAID 5 配置运行我的数据库吗？

Question

Tim

Asked: 2009-07-09 08:08:24 +0800 CST2009-07-09 08:08:24 +0800 CST 2009-07-09 08:08:24 +0800 CST

将大型数据集快速批量导入 MySQL

772

我有一个相当大的数据集，我需要将其导入 MySQL。我想尽可能高效地这样做，因为我需要反复这样做。这有诀窍吗？有没有比扩展的 INSERT 语句更有效的方法？

为了解决评论中的问题，原始格式是 XML，尽管我已经有一个转换器可以将其转换为 CSV 格式。我正在使用 MySQL 5.1.x，目标数据库是 InnoDB。数据之间存在关系，但我没有任何约束，并且在大多数情况下数据不够干净，无法强加它们。

6 个回答

Voted

Sekenre · Answer 1 · 2009-07-09T08:30:50+08:00

Best Answer

Sekenre

2009-07-09T08:30:50+08:002009-07-09T08:30:50+08:00

试试mysqlimport，你可以直接从 CSV 文件导入。

3

James · Answer 2 · 2009-07-09T10:26:48+08:00

James

2009-07-09T10:26:48+08:002009-07-09T10:26:48+08:00

我会阅读mysql手册，我在考虑 INSERT AFTER ，但是 LOAD DATA INFILE 看起来很有趣“快了 20 倍”......

2

croat_kevin · Answer 3 · 2009-07-09T10:10:13+08:00

croat_kevin

2009-07-09T10:10:13+08:002009-07-09T10:10:13+08:00

有一个名为Pentaho Data Integration的开源 ETL 工具，它有一个 mysql 批量加载选项（在设计视图中的实验文件夹下）。您还可以使用他们的 CSV 输入和表输出步骤以与平台无关的方式快速加载数据。如果您需要在加载数据之前对数据进行任何处理，您可以在此程序中对该逻辑进行编码。

1

Dan Carley · Answer 4 · 2009-07-09T10:24:20+08:00

Dan Carley

2009-07-09T10:24:20+08:002009-07-09T10:24:20+08:00

使用/*!40000 ALTER TABLE tbl_name DISABLE KEYS */;和/*!40000 ALTER TABLE tbl_name ENABLE KEYS */;围绕每个表的 INSERT 语句。

这将确保在所有行都存在之后创建非唯一索引，而不是尝试逐个构建它们。

0

Chris K · Answer 5 · 2009-07-09T10:31:41+08:00

Chris K

2009-07-09T10:31:41+08:002009-07-09T10:31:41+08:00

即使是批量“插入......”也不应该花费太长时间。我导出了一个 200MB 的新 JIRA 数据库，并在大约 30 秒内加载到一个原始数据库中。

0

Juan Jimenez · Answer 6 · 2020-10-29T07:42:06+08:00

Juan Jimenez

2020-10-29T07:42:06+08:002020-10-29T07:42:06+08:00

您想使用LOAD DATA语句。如果您没有 sudo privs，您还想使用 LOCAL 选项，以便您可以从放置数据的任何位置加载数据。LOAD DATA 在我的 Dell T5600 上以惊人的速度吸入数据，大约每 2-3 分钟 1 GB。我刚刚在 1 小时 13 分钟内完成了大约 3700 万条记录的 8GB 负载。

0

将大型数据集快速批量导入 MySQL

SFTP 使用什么端口？

从 IP 地址解析主机名

如何按大小对 du -h 输出进行排序

命令行列出 Windows Active Directory 组中的用户？

Windows 中执行反向 DNS 查找的命令行实用程序是什么？

如何检查 Windows 机器上的端口是否被阻塞？

我应该打开哪个端口以允许远程桌面？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

将大型数据集快速批量导入 MySQL

6 个回答

相关问题