lit Asked: 2019-04-25 10:04:59 +0800 CST2019-04-25 10:04:59 +0800 CST 2019-04-25 10:04:59 +0800 CST notepad.exe 是如何确定字符编码的? 772 我有一个以 UTF-8 格式保存的没有 BOM 的 .txt 文件。它包含一个 'é' 字符。 notepad.exe如何判断是UTF-8编码的呢? 其他仅包含 < 0x80 个字符的 .txt 文件将以“ANSI”编码打开。 windows character-encoding 1 个回答 Voted Best Answer user1686 2019-04-25T10:20:21+08:002019-04-25T10:20:21+08:00 据雷蒙德陈说: 某些文件在记事本中出现异常 [...] 当面对缺少特殊前缀的文件时,记事本被迫猜测文件实际使用的是这两种编码中的哪一种。执行这项工作的函数是IsTextUnicode,它研究一大块字节并进行一些统计分析以得出猜测。 正如文件所指出的那样,“不能保证绝对确定。” 短字符串最有可能被误检测。 (相关后续博文。)
据雷蒙德陈说:
(相关后续博文。)