我来自 Microsoft SQL Server 数据库世界,已经在那里工作了大约 7 年。我的新角色完全基于各种开源数据库引擎。
当我一直在准备迁移到 AWS RDS 和/或更新版本的 MariaDB 时,我想到了一个关于我公司备份策略的问题。ATM,为了避免敏感细节,没有任何解决方案。最受关注的数据库都运行在较旧的 TokuDB 存储引擎上,并且是需要迁移的有问题的数据库。备份这些数据库主要是通过以下方法完成的,而不是将整个数据库通过管道传输到一个 .sql 文件中
mysqldump -u root -p -t -T/$source $database $databasetable --fields-terminated-by='|' --lines-terminated-by='\n' --order-by-primary
我可以简单地说备份整个数据库并让它一次吐出每个表,但无论如何,这需要几个小时。进行普通的 sql 转储,无论是否使用 gzip,都需要 24 小时以上,甚至更多。这显然不是最好的标准备份策略,就像您可以在 Ola Hallengren 的 Microsoft SQL Server 维护计划中找到的那样。但是,我能想到的唯一替代方法是用 python 编写一些东西或使用 cronjob 来执行备份尚未确定的时间表。
我找到的唯一解决方案是 Percona 的 XtraBackup,但想看看社区是否有其他想法。
更多背景:
这些数据库服务器在 AWS 和 Ubuntu 上作为 EC2 实例运行,并配置为 m4.large 或 m4.xlarge。
有多个主副本,因此理想情况下备份应该在主副本上完成,而不是副本
最后提到 是 - 迁移到 RDS 是一个选项,这将通过自动备份消除这个问题。然而,这些旧的 Tokudb 服务器的迁移不会“那么”容易,所以我们可能需要一些时间才能到达那里。
我将不胜感激任何意见或建议。谢谢你。