迁移后,我正在尝试修复数据库中字符字段的一些损坏。我怀疑部分问题是带有 UTF-8 数据的字段是用 MySQLlatin1
字符集解释的。在我尝试解决问题之前,我想了解它。其中一部分是要准确理解latin1
字符集是什么。
latin1
MySQL 8.0 和 MySQL 5.7 中字符集的代码点(字节值)和字符之间映射的正式定义是什么?如果整理很重要,我会接受latin1_swedish_ci
整理的答案。
latin1
据说与Windows CP-1252编码相同。在关于 CP-1252 的 Wikipedia 文章中,有一个 256 字节码值的表格,表格的每个单元格中都有一个字符。这就是我所追求的那种定义。但是,我希望有比“它与 CP-1252 相同”和“维基百科中的那个表可能是准确的”更严格的东西。
我试过浏览 MySQL 文档。我希望10.10.2 West European Character Sets想要正式的定义,但我在那里看不到。我在这里或维基百科上也没有看到答案。
如果有一个 MySQL 源文件定义了latin1
,并且我可以通过 URL 查看该源文件,那可能就足够了。但如果有人组成了一个 256 单元格的表格,那就更好了。