我有一个文件
СМП бваг™вга†
前三个字母是正确的西尔字母,其余部分是莫吉巴克字母。
“ Mojibake是使用非预期的字符编码对文本进行解码而产生的乱码或胡言乱语的文本。” — 维基百科
最初是
СМП структура
但后来不知怎么的就变成了乱码,很可能是因为该文件是由一个不熟练的用户在 Windows XP 上压缩的,然后在 Mac 上解压的。
convmv
我尝试使用和修复它iconv
,如下所示:
convmv -r -f cp1251 -t utf-8 DIR
ls | iconv -f cp1251 -t cp850 | iconv -f cp866
但尚未成功。有人能帮忙吗?
更新 1
十六进制转储СМП бваг™вга†
:
0000000 d0 a1 d0 9c d0 9f 20 d0 b1 d0 b2 d0 b0 d0 b3 e2
С ** М ** П ** б ** в ** а ** г ** ™
0000020 84 a2 d0 b2 d0 b3 d0 b0 e2 80 a0 0a
** ** в ** г ** а ** † ** ** \n
0000034
十六进制转储СМП структура
:
0000000 d0 a1 d0 9c d0 9f 20 d1 81 d1 82 d1 80 d1 83 d0
С ** М ** П ** с ** т ** р ** у ** к
0000020 ba d1 82 d1 83 d1 80 d0 b0 0a
** т ** у ** р ** а ** \n
0000032