Rui F Ribeiro Asked: 2018-03-03 10:37:27 +0800 CST2018-03-03 10:37:27 +0800 CST 2018-03-03 10:37:27 +0800 CST MySQL:不正确的字符串值 772 我在网页中的某些字符上遇到了一些问题,我们在 UTF8 中经常遇到这些问题。 我正在使用 Debian 9 运行 MySQL 5.7。我的数据库正在使用utf8字符集。 今天在调试一个mysql查询的时候,跑到SHOW WARNINGS;Message字段中看到: Incorrect string value: '\xF0\x9D\x8C\x86' for column `xxxx`; 怎么了? debian mysql 1 个回答 Voted Best Answer Rui F Ribeiro 2018-03-03T10:37:27+08:002018-03-03T10:37:27+08:00 最终,通过谷歌搜索错误,我发现了几篇文章,表明在 MySQL 中,utf8字符集是错误的/大脑受损,不应该使用。 在它的替换中,应该使用utf8mb4字符集来代替。 在MySQL 中,永远不要使用“utf8”。使用“utf8mb4” MySQL 的“utf8”不是 UTF-8。 “utf8”编码仅支持每个字符三个字节。真正的 UTF-8 编码——包括你在内的每个人都在使用——每个字符最多需要四个字节。 MySQL 开发人员从未修复过这个错误。他们在 2010 年发布了一个解决方法:一个名为“utf8mb4”的新字符集。 简而言之: - MySQL 的“utf8mb4”表示“UTF-8”。 - MySQL 的“utf8”表示“专有字符编码”。这种编码不能编码许多 Unicode 字符。 我将在这里做一个全面的声明:所有当前使用“utf8”的 MySQL 和 MariaDB 用户实际上应该使用“utf8mb4”。没有人应该使用“utf8”。 从如何在 MySQL 数据库中支持完整的 Unicode 原来 MySQL 的 utf8 字符集仅部分实现了正确的 UTF-8 编码。它只能存储由一到三个字节组成的 UTF-8 编码符号;不支持占用四个字节的编码符号。 如上所示,这种行为可能会导致数据丢失,但情况会变得更糟——它可能会导致安全漏洞。以下是一些示例,所有示例都是在发布此文章后发现的: WordPress < 3.6.1 中的 PHP 对象注入漏洞,导致与某些 WordPress 插件结合远程执行代码 WordPress 4.1.2 中 Phabricator 存储的 XSS 中的电子邮件身份验证绕过 Joomla 中的远程命令执行!内容管理系统 TL;DR MySQL 的utf8编码名称很尴尬,因为它与正确的 UTF-8 编码不同。它不提供完整的 Unicode 支持,这可能导致数据丢失或安全漏洞。
最终,通过谷歌搜索错误,我发现了几篇文章,表明在 MySQL 中,
utf8
字符集是错误的/大脑受损,不应该使用。在它的替换中,应该使用
utf8mb4
字符集来代替。在MySQL 中,永远不要使用“utf8”。使用“utf8mb4”
从如何在 MySQL 数据库中支持完整的 Unicode