Alguns anos atrás eu escrevi algumas anotações em um arquivo .txt (texto simples) no Bloco de Notas e quando o abri recentemente ele apareceu com esses caracteres estranhos . Não sei em que ponto ficou assim, mas pode ter sido no meio de uma transição de Windows 7 -> Unidade Externa -> Windows 10 (atual).
Outros arquivos .txt que estavam na mesma pasta deste ficaram assim, embora a maioria não tenha mudado. Isso me faz suspeitar de um erro de conversão entre o sistema operacional da Microsoft ou os arquivos foram corrompidos.
Além disso, quando abri com o Notepad ++, esse mesmo arquivo foi escrito assim . Quando copiei para a caixa de texto do google translate, os caracteres com fundo preto se transformaram em algum tipo de matriz codificada , então talvez possa dar algum tipo de pista.
Já tentei decodificar de várias formas sem sucesso. Talvez alguém tenha alguma ideia se este é um problema que pode ser resolvido através da decodificação para Texto Simples (ASCII), ou se os arquivos estão corrompidos e não há como voltar atrás.
Obrigado.
Os arquivos foram corrompidos. Pode ser um problema de hardware ou um problema de sistema operacional, embora seja muito mais provável que eles tenham sido corrompidos ao copiar de/para a unidade externa (por exemplo, através de uma conexão USB ruim ou a unidade foi danificada) e não durante uma atualização do sistema operacional.
Estes são "caracteres de controle" - eles devem ser interpretados por programas e não mostrados na tela, e normalmente não ocorreriam em um arquivo de texto (exceto para CR/LF/TAB, é claro). Portanto, eles não têm uma representação visual padrão e diferentes programas têm maneiras diferentes de exibi-los, caso ocorram :
O Notepad++ (bem, seu núcleo Scintilla) mostra o nome de cada caractere do padrão ASCII, por exemplo, o byte 0x03 é "EOT" (Fim da transmissão) e 0x18 é "CAN" (Cancelar). Alguns desses nomes datam da era do telégrafo.
Seu navegador usa o mesmo método para mostrar todos os caracteres não imprimíveis – a 'matriz' é apenas um número de quatro dígitos indicando o ponto de código Unicode desse caractere. (Neste caso, eles são o U+0018 também conhecido como CAN, U+0003 também conhecido como EOT e assim por diante.)
Você pode ver a mesma caixa com dígitos para qualquer caractere que o sistema operacional não tenha em suas fontes, por exemplo, ele aparecerá para emojis recém-lançados que o sistema operacional/navegador ainda não suporta.
No Notepad ++, o arquivo parece meio UTF-8 e meio lixo (os 'A's acentuados tendem a aparecer quando um arquivo UTF-8 é mal interpretado como Windows-1252).
No entanto, neste caso, provavelmente é apenas uma coincidência e provavelmente não há mais nada decodificável neste arquivo.
Provavelmente tarde demais para o OP, mas pensei que alguém como eu poderia enfrentar o mesmo problema e vir aqui para o que parece ser um beco sem saída. Mas encontrei uma solução! Eu simplesmente carreguei o arquivo no Google Drive e abri usando o Google Docs... e estava tudo bem! Em seguida, salvei novamente os dados como um arquivo do Word e espero que seja isso. Não sou especialista, mas parece-me que o bloco de notas ou o Windows sofreram algumas alterações nos últimos dois anos, desde que criei o arquivo txt original. Espero que isso possa ajudar alguém.
Isso aconteceu comigo quando fiz a transição do Windows 7 para o 10. Antes disso, nunca tive problemas e usei dezenas de arquivos de texto por 20 anos, tudo bem. Isso está no Windows 10 desde seu lançamento e ainda está lá. Meu conselho é manter seus arquivos de texto com vários backups seriais e mantê-los abaixo do tamanho de 300K. Você precisará dos backups para reparar o texto ilegível (copiar e colar), porque o problema surgirá e descartará parte do seu arquivo se você usar o Windows 10. Essa é a resposta.