我想使用 Microsoft Word(特别是在 PC 上)打开、编辑并再次保存 UTF-8 格式的纯文本文件,但不在开头添加 BOM 字符序列。
让我们继续假设我询问的是关于 Word 2010 之后的任何版本的 Word。
我在“另存为”对话框中看不到执行此操作的选项,在我能看到的任何其他地方也看不到。
我可以看到这个问题多次被问到关于其他程序的问题,但我没有看到任何特定于 Word 的问题。
我想使用 Microsoft Word(特别是在 PC 上)打开、编辑并再次保存 UTF-8 格式的纯文本文件,但不在开头添加 BOM 字符序列。
让我们继续假设我询问的是关于 Word 2010 之后的任何版本的 Word。
我在“另存为”对话框中看不到执行此操作的选项,在我能看到的任何其他地方也看不到。
我可以看到这个问题多次被问到关于其他程序的问题,但我没有看到任何特定于 Word 的问题。
您不能直接在 Word 中执行此操作,因为没有 BOM 就无法确保文件以 UTF-8 编码。请记住,没有纯文本这样的东西。
尽管名称如此,但 BOM 并不用于 UTF-8 中的字节顺序标记,而是用作签名。如果没有签名,每次打开文件时Word 都会要求您确认编码,因为如果文件是 ANSI 代码页(这仍然是 Windows 中的默认设置)怎么办。它具有很好的启发式算法,并且大多数时候都能正确猜测,尤其是对于像 UTF-8 这样容易猜到的编码。根据我的经验,即使对于各种语言的棘手编码,它也能很好地工作
也就是说,您可以编写一个宏来完成保存部分,而不是使用 Word 的保存功能。看
或者,只需在使用其他工具(如 PowerShell、iconv、Notepad++ 或第 3 方编辑器)使用 Word 保存后删除BOM。这是进行转换的 PowerShell 脚本