Estou seguindo este tutorial: http://nbviewer.jupyter.org/github/amsehili/audio-segmentation-by-classification-tutorial/blob/master/multiclass_audio_segmentation.ipynb
No bloco [8] do tutorial existe:
train_data = {}
train_data["silence"] = ["silence_1.wav", "silence_2.wav", "silence_3.wav"]
train_data["speech"] = ["speech_1.wav", "speech_2.wav", "speech_3.wav", "speech_4.wav", "speech_5.wav"]
ou seja, estamos passando os nomes dos arquivos .wav contidos em uma pasta;
Em vez de silêncio/fala, quero treinar/passar meus próprios segmentos musicais. Então, cortei um bit de música em pedaços menores usando:
ffmpeg -i hm1.mp3 -c copy -map 0 -segment_time 1 -f segment hm1_%03d.mp3
Isso gerou 120 1 second long mp3 chunks
do arquivo original. Salvei os nomes dos arquivos desses blocos de 1 segundo usando
ls >filenames.txt
É impossível digitar 120 "abc.wav" ,
, qual é a melhor maneira de passar todos os mais de 120 nomes de arquivos dos bits de música gerados no formato mostrado acima.
Obter Python para construir a lista?