Eu tenho vários arquivos de origem LaTeX, todos têm a mesma estrutura, todos têm finais de linha no estilo Unix e todos são UTF-8, todos têm aproximadamente o mesmo tamanho (1-2 KB), todos usam espaços para formatação de recuo. Eles são incluídos em um documento maior, cada arquivo lidando com uma seção separada no documento com cada seção tendo o mesmo layout (então cada arquivo é estruturado de forma idêntica com basicamente os mesmos comandos LaTeX, apenas com conteúdo de texto diferente), então todos os arquivos iniciam diretamente /end com e contém muitos comandos LaTeX. O estranho agora é o seguinte:
$ file *.tex
file1.tex: LaTeX document, Unicode text, UTF-8 text
file2.tex: CSV text
Este é apenas um pequeno trecho, a detecção de CSV vs. LaTeX é totalmente aleatória, enquanto CSV é detectado com um pouco menos de frequência (talvez 40% CSV, 60% LaTeX), mas para cada arquivo o tipo é reproduzível.
Tentei variar alguma formatação e conteúdo em arquivos detectados por CSV, mas eles permanecem detectados como CSV.
O que está acontecendo aqui?