AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 440
Accepted
Hendrik Brummermann
Hendrik Brummermann
Asked: 2011-01-10 03:20:03 +0800 CST2011-01-10 03:20:03 +0800 CST 2011-01-10 03:20:03 +0800 CST

如何在不离线几个小时的情况下将 66,862,521 行的表从 MyISAM 转换为 InnoDB?

  • 772

是否有可能(以及如何)将一个巨大的 MyISAM 表转换为 InnoDB 而无需使应用程序脱机。它需要每秒向该表中插入几行,但可以将其暂停大约 2 分钟。

显然 ALTER TABLE ... engine=innodb 将不起作用。因此,我计划使用 innodb 引擎创建一个新表并将内容复制到其中。最后,挂起应用程序日志线程和重命名表。

不幸的是,即使以 100 行的小批量进行复制也会在一段时间后产生明显的延迟。

编辑:现有行永远不会更改,此表用于记录。

mysql innodb
  • 4 4 个回答
  • 1689 Views

4 个回答

  • Voted
  1. Best Answer
    Derek Downey
    2011-01-10T13:55:52+08:002011-01-10T13:55:52+08:00

    创建一个 Master-Master 设置,如下所示:

    • 创建第二个master,MasterB
    • MasterB 充当从属logTable
    • 创建logTable_new为 innodb
    • INSERT INTO logTable_new SELECT * FROM logTable在 MasterB 上运行(伪代码),将复制发送到 MasterA
    • 在logTable_newMasterA 上完成同步后,换出表格
    • 15
  2. Joe
    2011-01-10T09:05:56+08:002011-01-10T09:05:56+08:00

    鉴于以下约束:

    我不在乎谈话需要几天还是几周。但它必须在后台运行,不需要应用程序停机,也不会产生明显的延迟

    在进行日志记录时,如果您有一些好的方法来设置标记,这样您就可以知道您开始该过程的原因,然后您可以重新应用任何日志,或者将日志写入文本文件,这样你可以稍后摄取它们LOAD DATA INFILE

    部分问题是小批量写入意味着必须一遍又一遍地重新计算索引;您最好一次运行它,但这可能会导致系统出现一些“明显”的延迟......但您不必在生产服务器上执行此操作。

    1. 暂停日志记录或设置一些标记,以便您以后可以重新应用日志。
    2. 将您的 MyISM 表复制到另一个系统
    3. 在另一个系统上,以不同的名称创建一个 InnoDB 表并迁移数据 (转储并使用它甚至可能更快LOAD DATA INFILE)
    4. 将 InnoDB 表复制回原始系统
    5. 为日志记录设置另一个标记。
    6. 将最后两个标记之间的所有日志重新应用到新表。
    7. (如果第 6 步花费的时间超过一分钟左右,请重复第 5 步和第 6 步,直到只有几秒钟)
    8. 交换表(将旧表重命名为 table_BACKUP,新表在旧表名下)
    9. 赶上自上次标记以来的日志。
    • 10
  3. David Spillett
    2011-01-10T05:30:14+08:002011-01-10T05:30:14+08:00

    不幸的是,即使以 100 行的小批量进行复制也会在一段时间后产生明显的延迟。

    您是在每个批次之间添加任何延迟,还是只是将更新分批并在前一个批次之后直接运行每个批次?

    如果是这样,请尝试使用您喜欢的语言编写转换脚本,例如:

    repeat
        copy oldest 100 rows that haven't been copied yet to new table
        sleep for as long as that update took
    until there are <100 rows unprocessed
    stop logging service
    move the last few rows
    rename tables
    restart logging
    delete the old table when you are sure the conversion has worked
    

    这应该确保转换不会占用服务器容量的一半以上,即使考虑到系统使用随时间变化而施加的负载差异。

    或者,如果您想在服务相对空闲但在数据库需要为其用户做一些工作时退出(可能暂停相当长的时间)时尽可能多地使用时间,请替换sleep for as long as the update took为if the server's load is above <upper measure>, sleep for some seconds then check again, loop around the sleep/check until the load drops below <lower measure>. 这意味着它可以在安静的时候继续前进,但在服务器忙于执行其正常工作负载时会完全暂停。确定负载将取决于您的操作系统 - 在 Linux 下和类似的 1 分钟负载平均值/proc/loadavg或uptime应该做的输出。<lower measure>并且<upper measure>可能是相同的值,尽管在这样的控件中通常会有差异,因此您的进程不会继续启动然后立即暂停,因为它自己的重新启动会对负载测量产生影响。

    当然,这不适用于旧行可能会被修改的表,但对于您描述的日志表来说可以正常工作。

    在这种情况下,您将需要忽略在填充新表后创建索引的通常做法。虽然当您希望事情尽可能快时确实更有效(对系统其余部分的影响被诅咒),但在这种情况下,您不希望在流程结束时出现大量负载,因为索引是一次性完全创建的,因为这是一个在事情繁忙时不能暂停的过程。

    • 9
  4. Riedsio
    2011-01-14T12:55:05+08:002011-01-14T12:55:05+08:00

    像这样的东西会起作用吗?

    1. 暂停日志记录(因此$auto_increment您的日志记录表上的mytable 不会改变)。
    2. 注意$auto_increment使用的值SHOW TABLE STATUS LIKE 'mytable'。
    3. CREATE TABLE mytable_new LIKE mytable
    4. ALTER TABLE mytable_new AUTO_INCREMENT=$auto_increment ENGINE=Innodb
    5. RENAME TABLE mytable TO mytable_old, mytable_new TO mytable
    6. 再次启用日志记录。Innodb 表现在将开始填充。
    7. INSERT INTO mytable SELECT * FROM mytable_old.

    您可以分批或在一个语句中执行第 7 步,因为它不应该阻塞正常的日志记录。

    • 4

相关问题

  • 是否有任何 MySQL 基准测试工具?[关闭]

  • 我在哪里可以找到mysql慢日志?

  • 如何优化大型数据库的 mysqldump?

  • 什么时候是使用 MariaDB 而不是 MySQL 的合适时机,为什么?

  • 组如何跟踪数据库架构更改?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    您如何显示在 Oracle 数据库上执行的 SQL?

    • 2 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    我可以查看在 SQL Server 数据库上运行的历史查询吗?

    • 6 个回答
  • Marko Smith

    如何在 PostgreSQL 中使用 currval() 来获取最后插入的 id?

    • 10 个回答
  • Marko Smith

    如何在 Mac OS X 上运行 psql?

    • 11 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Marko Smith

    将数组参数传递给存储过程

    • 12 个回答
  • Martin Hope
    Manuel Leduc PostgreSQL 多列唯一约束和 NULL 值 2011-12-28 01:10:21 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Stuart Blackler 什么时候应该将主键声明为非聚集的? 2011-11-11 13:31:59 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    BrunoLM Guid vs INT - 哪个更好作为主键? 2011-01-05 23:46:34 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST
  • Martin Hope
    Patrick 如何优化大型数据库的 mysqldump? 2011-01-04 13:13:48 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve