Eu tenho um arquivo
СМП бваг™вга†
As três primeiras letras são cirílicas e a parte restante é mojibake .
" Mojibake é um texto distorcido ou incompreensível que é o resultado de um texto decodificado usando uma codificação de caracteres não intencional." — Wikipédia
Originalmente, era
СМП структура
mas então ficou confuso de alguma forma, provavelmente porque o arquivo foi compactado no Windows XP e depois descompactado em um Mac, por um usuário inexperiente.
Tentei consertar usando convmv
and iconv
, assim:
convmv -r -f cp1251 -t utf-8 DIR
ls | iconv -f cp1251 -t cp850 | iconv -f cp866
mas ainda não obtive sucesso. Alguém pode ajudar com isso?
atualização 1
Hexdump de СМП бваг™вга†
:
0000000 d0 a1 d0 9c d0 9f 20 d0 b1 d0 b2 d0 b0 d0 b3 e2
С ** М ** П ** б ** в ** а ** г ** ™
0000020 84 a2 d0 b2 d0 b3 d0 b0 e2 80 a0 0a
** ** в ** г ** а ** † ** ** \n
0000034
Hexdump de СМП структура
:
0000000 d0 a1 d0 9c d0 9f 20 d1 81 d1 82 d1 80 d1 83 d0
С ** М ** П ** с ** т ** р ** у ** к
0000020 ba d1 82 d1 83 d1 80 d0 b0 0a
** т ** у ** р ** а ** \n
0000032