我的文本文件有格式问题。我假设它最初是 Windows-1252。然后我尝试使用 Notepad++ 将文件重新格式化为另一种编码格式,做了几次,结果一团糟,比如???A??a?s??A§???A??a?s??A ???A??a?s??Aµ???A??a?s??A®???A??a?s??A¤????????????
. 我不记得我所做的实际操作顺序。我唯一确定的是我在 ANSI、UTF-8 和 Windows-1251 之间切换。这些都没有让我的文本恢复到正确的西里尔格式,这是以前的。
那么,有没有办法找回我在这个文件中的信息呢?txt 文件是否包含所有信息,我只需要弄清楚我需要什么编码格式,或者它被替换并且信息永远丢失了吗?最初,我在文件中有一些西里尔文字。
抱歉,目前无法恢复文本。
问题是,并非所有字符集都具有相同的字符范围。
当您在字符集之间切换时,系统会尝试以某种方式保留字符。但由于并非所有字符集都有所有字符,因此在此过程中字符丢失,因此这些文件永久乱码。
在您的示例中,如果您从 Cyrillic(应该是UTF-8)到 ANSI(又名:Windows-1252),然后再到Windows-1251(一个较旧的 Cyrillic 脚本),每次转换都会丢失数据。
对不起,但某种备份是你唯一的希望。
FWIW,本页——“这些有趣的角色是从哪里来的?” — 很好地解释了这是如何发生的以及这些问号 (
?
) 的含义: