Eu tenho esses arquivos .m4a para os quais ffprobe
(no Debian 12.1) relatórios:
Stream #0:1[0x2](eng): Data: bin_data (text / 0x74786574), 0 kb/s
Metadata:
handler_name : SubtitleHandler
Unsupported codec with id 98314 for input stream 1
São letras de músicas e, em caso afirmativo, como posso extraí-las como texto simples?
Eles são, provavelmente, marcadores de capítulo.
Eu estava procurando
bin_data
inicialmente, mas tudo que encontrei foi:Mas encontrar esta postagem me deu um arquivo semelhante para testar.
Então, pesquisando por
bin_data (text...)
me levou a este post em superuser.com:Ao ver o resultado da
text.bin
faixa, descobrimos que são marcadores de capítulo, não letras, infelizmente. Eu olhei paratext.bin
si mesmo e mostra:O que parece estar alinhado com a saída do capítulo.
Não tenho ideia de qual é a codificação desse arquivo, mas se você quiser que os metadados sejam gerados corretamente em um arquivo:
Isso produzirá o texto entre
Output #0, data, to 'text.bin':
eStream mapping:
doffmpeg
log.