我有一个 UTF-8 文件,其中包含一个奇怪的字符——对我来说就像
<96>
这就是它的显示方式vi
以及它是如何出现的gedit
以及它在 LibreOffice 下的显示方式
这使得一系列基本的 Unix 工具行为不端,包括:
cat file
使角色消失,more
以及- 我无法在 vi/vim 中复制和粘贴——它甚至找不到自己
grep
也无法显示任何内容,就好像该角色不存在一样。
该程序file
运行良好,并将其识别为 UTF-8 文件。我也知道,由于文件的性质,它很可能来自网络上的复制和粘贴,并且该字符最初代表 EMDASH。
我的基本问题是:
- 这个文件有什么问题吗?
- 如何在同一文件中搜索它的其他出现?
- 如何查找可能包含相同问题/字符的其他文件?
该文件可以在这里找到:file.txt