我正在关注本教程: http: //nbviewer.jupyter.org/github/amsehili/audio-segmentation-by-classification-tutorial/blob/master/multiclass_audio_segmentation.ipynb
在教程的 [8] 块中有:
train_data = {}
train_data["silence"] = ["silence_1.wav", "silence_2.wav", "silence_3.wav"]
train_data["speech"] = ["speech_1.wav", "speech_2.wav", "speech_3.wav", "speech_4.wav", "speech_5.wav"]
即我们正在传递包含在一个文件夹中的 .wav 文件的名称;
我想训练/传递我自己的音乐片段,而不是沉默/演讲。所以,我使用以下方法将一首音乐切成更小的片段:
ffmpeg -i hm1.mp3 -c copy -map 0 -segment_time 1 -f segment hm1_%03d.mp3
这生成了 1201 second long mp3 chunks
个原始文件。我使用保存了这些 1 秒块的文件名
ls >filenames.txt
无法键入 120 "abc.wav" ,
what is the best way to pass the all 120+ file names of the generated music bits in the format 如上所示。
让 Python 构建列表?