我想使用 mysqldump 备份存储在 MySQL 服务器 5.1.36 中的 mediawiki 数据库。
大多数 wiki 文章都是用西班牙语编写的,并且不想通过使用错误的字符集创建转储来搞砸它。
mysql> status
--------------
...
Current database: wikidb
Current user: root@localhost
...
Server version: 5.1.36-community-log MySQL Community Server (GPL)
....
Server characterset: latin1
Db characterset: utf8
Client characterset: latin1
Conn. characterset: latin1
...
使用以下命令:
mysql> show create table text;
我看到 table create 语句将字符集设置为binary:
CREATE TABLE `text` (
`old_id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`old_text` mediumblob NOT NULL,
`old_flags` tinyblob NOT NULL,
PRIMARY KEY (`old_id`)
) ENGINE=InnoDB AUTO_INCREMENT=317 DEFAULT CHARSET=binary MAX_ROWS=10000000 AVG_ROW_LENGTH=10240
我应该如何使用 mysqldump 为该数据库正确生成备份?
mysqldump
并且show create table
通常是非常可靠的主力,不应自行更改编码。如果他们使用“二进制”字符集,很可能这实际上是给表的字符集(但不一定是columns)。您可以在数据库浏览器中重新检查当前表字符集吗?我会尝试一个简单
mysqldump
的文件,将转储恢复到镜像数据库中,并仔细查看特殊字符。与使用 phpMyAdmin 进行的备份不同,根据我的经验,来自命令行的备份往往效果很好。备份数据库是一件至关重要的事情,因此请勇敢地使用它。
我建议测试您的备份策略,不仅因为担心语言问题,还因为对于许多组织而言,最重复的臭名昭著的最严重灾难场景之一是从未测试过并且多年来一直做错的备份 - 并且当最终需要它时,它不在那里,正在工作。应该测试整个备份过程。
首先,停止所有服务器活动并进行操作系统备份。这绝不是一个坏主意,除非服务器停机会导致停机。一些数据库系统可以让您在数据库系统运行时进行操作系统备份,并且仍然可以创建完全有效的备份!PostgreSQL 就是这样一个系统——我强烈推荐它。
至于字符集,Unicode(又名 UTF-8)包含所有西班牙语,但 ISO-8859-1 被广泛选择。
请参阅这些参考资料:
Unicode characters和 The Unicode Consortium,我认为这个也可能有帮助:MySQL Character Set for ISO-8859-1
我还建议进行第二次安装并将备份恢复到其中。这做了三件事:
如果您不想停止服务器进行备份,我强烈建议您查看 Xtrabackup。此工具执行 InnoDB(和 XtraDB)表的在线备份。我在生产服务器上使用它。它不会对它们造成太大压力,并且可以执行增量备份。