Tenho alguns arquivos com caracteres especiais como letras acentuadas.
Eles são nomes válidos, mas, por algum motivo, quando são copiados pela rede para uma unidade, talvez em outro formato, o nome ainda parece o mesmo, mas não é o mesmo.
Posso copiar o arquivo de volta e agora tenho dois arquivos que parecem ter exatamente o mesmo nome no mesmo caminho.
Meu palpite é que existem dois valores diferentes representados pela letra acentuada para que pareçam iguais. Existe alguma maneira de visualizar o hexadecimal do próprio nome, não o arquivo?
Isso é importante porque um dos meus aplicativos de sincronização está ficando confuso e criando duplicatas.
Encaminhe os nomes dos arquivos para
od
ou uma ferramenta semelhante:Muitos caracteres podem ter representações diferentes, mesmo na mesma codificação; por exemplo, em UTF-8, 0xC3 0xA9 representa é, e 0x65 0xCC 0x81 representa e seguido por “combinar acento agudo”, que também é exibido como é. Essas strings precisam ser normalizadas para serem comparadas, mas mesmo a normalização tem variantes diferentes, e sistemas operacionais diferentes podem armazenar a mesma string de maneiras diferentes.