Ingo Asked: 2010-09-19 02:45:57 +0800 CST2010-09-19 02:45:57 +0800 CST 2010-09-19 02:45:57 +0800 CST 如何找到重复的歌曲? 772 标题说明了一切。如何检测媒体库中的重复项? rhythmbox music duplicate-files 7 个回答 Voted Best Answer Li Lo 2010-12-01T07:30:38+08:002010-12-01T07:30:38+08:00 dupeGuru 音乐版是您想要的。在首选项中将扫描类型设置为“音频内容”。请注意,该程序是fairware,因此请尽可能提供帮助。 我建议你将它与MusicBrainz Picard结合使用,它可以自动标记你的音乐文件。 Marco Ceppi 2010-09-19T04:48:18+08:002010-09-19T04:48:18+08:00 前段时间为此制作了一个插件。我最近使用过它,但它仍然有一些不足之处。它有一个“ PPA ”——但还没有构建包,只有 Bazaar 分支。安装说明是这样的: wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz 如果您有兴趣使用 Bazaar 的源代码,请改为执行以下操作: mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source 安装后重新启动 Rhythmbox,您现在应该在插件列表中有一个 Duplicates Finder。 激活后 - 有额外的配置选项可用。 启用插件后 - 当它找到重复项时 - 它会在您的库列表中添加一个附加选项: 我发现一些“奇怪”的设置 - 我已经在一个包含超过 120,000 首歌曲(超过 1,000 个重复项)的媒体库和一个包含大约 1,000 首歌曲并且可能有 30 个重复项的库上尝试了这个。在前者上,它花费了很长时间并且在搜索过程中多次崩溃 Rhythmbox。我最终选择了自动“从库中删除”以避免重建列表。不过,在较小的库上,一切都很好。 找到副本时 - 如果您选择了默认选项 - 歌曲的较低质量版本将被添加到列表中。因此可以安全地选择重复列表中的所有歌曲并“删除”(从磁盘中删除或从库中删除)。 Johann 2010-11-01T11:44:28+08:002010-11-01T11:44:28+08:00 您可以为此使用fdupes: $ fdupes -r ~/Music 它为您提供了所有重复文件的列表。 您可以轻松地安装它 sudo apt-get install fdupes John Bode 2010-12-01T07:56:14+08:002010-12-01T07:56:14+08:00 当我有一堆重复的图像文件时,我遇到了类似的问题。就我而言,我只是md5sum在文件上使用并对结果进行了排序: for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort 具有相同内容的文件生成相同的哈希,因此可以轻松找到重复项。我从那里手动删除了欺骗,虽然我可以扩展脚本以删除除第一次出现之外的所有内容,但我总是偏执于在临时脚本中这样做。 请注意,这仅适用于具有相同内容的重复文件。 derat 2022-02-15T04:10:49+08:002022-02-15T04:10:49+08:00 可能晚了十几年,但我刚刚写了一个命令行程序,试图通过比较声学指纹来检测相似的音频文件:https ://github.com/derat/soundalike 它使用Chromaprintfpcalc的实用程序来生成指纹,然后在更严格地比较指纹之前构建一个查找表以查找可能的匹配项。 FOSS DIVERSER 2010-12-01T02:36:42+08:002010-12-01T02:36:42+08:00 尝试FSlint或欺骗 gredtter 在终端中安装FSlint类型 (Ctrl-Alt-T) sudo apt-get install fslint 希望这是有用的.. Aputsiak 2010-09-19T07:15:00+08:002010-09-19T07:15:00+08:00 我通常使用FSlint来查找重复文件。FSlint 是“在文件系统上查找和清理各种形式的 lint 的实用程序”。
dupeGuru 音乐版是您想要的。在首选项中将扫描类型设置为“音频内容”。请注意,该程序是fairware,因此请尽可能提供帮助。
我建议你将它与MusicBrainz Picard结合使用,它可以自动标记你的音乐文件。
前段时间为此制作了一个插件。我最近使用过它,但它仍然有一些不足之处。它有一个“ PPA ”——但还没有构建包,只有 Bazaar 分支。安装说明是这样的:
如果您有兴趣使用 Bazaar 的源代码,请改为执行以下操作:
安装后重新启动 Rhythmbox,您现在应该在插件列表中有一个 Duplicates Finder。
激活后 - 有额外的配置选项可用。
启用插件后 - 当它找到重复项时 - 它会在您的库列表中添加一个附加选项:
我发现一些“奇怪”的设置 - 我已经在一个包含超过 120,000 首歌曲(超过 1,000 个重复项)的媒体库和一个包含大约 1,000 首歌曲并且可能有 30 个重复项的库上尝试了这个。在前者上,它花费了很长时间并且在搜索过程中多次崩溃 Rhythmbox。我最终选择了自动“从库中删除”以避免重建列表。不过,在较小的库上,一切都很好。
找到副本时 - 如果您选择了默认选项 - 歌曲的较低质量版本将被添加到列表中。因此可以安全地选择重复列表中的所有歌曲并“删除”(从磁盘中删除或从库中删除)。
您可以为此使用fdupes:
它为您提供了所有重复文件的列表。
您可以轻松地安装它
当我有一堆重复的图像文件时,我遇到了类似的问题。就我而言,我只是
md5sum
在文件上使用并对结果进行了排序:具有相同内容的文件生成相同的哈希,因此可以轻松找到重复项。我从那里手动删除了欺骗,虽然我可以扩展脚本以删除除第一次出现之外的所有内容,但我总是偏执于在临时脚本中这样做。
请注意,这仅适用于具有相同内容的重复文件。
可能晚了十几年,但我刚刚写了一个命令行程序,试图通过比较声学指纹来检测相似的音频文件:https ://github.com/derat/soundalike
它使用Chromaprint
fpcalc
的实用程序来生成指纹,然后在更严格地比较指纹之前构建一个查找表以查找可能的匹配项。尝试FSlint或欺骗 gredtter
在终端中安装FSlint类型 (Ctrl-Alt-T)
希望这是有用的..
我通常使用FSlint来查找重复文件。FSlint 是“在文件系统上查找和清理各种形式的 lint 的实用程序”。