ændrük Asked: 2010-09-13 09:01:16 +0800 CST2010-09-13 09:01:16 +0800 CST 2010-09-13 09:01:16 +0800 CST 如何找到重复的照片? 772 我可以使用什么来查找重复的照片,包括已调整大小的照片? software-recommendation photo-management 7 个回答 Voted Best Answer Gilles 'SO- stop being evil' 2010-09-13T11:01:35+08:002010-09-13T11:01:35+08:00 数码相机 将所有照片添加到您的收藏中。在菜单中,选择工具/查找重复项。这将在您的整个收藏中查找重复项。 查找图像重复 一个命令行工具。在命令行上传递您要比较的所有图像。 Geeqie(原GQview) 在菜单中,选择File / Find duplicate。拖放图像文件做重复窗口。您可以删除目录以递归方式添加其内容。对于图像的视觉比较,下拉菜单上有特定的非默认选项。“自定义”相似度级别允许仅将配对限制为最高相似度,但必须在Preferences上进行设置如 99。即便如此,至少对于某些类型的图像(如线条艺术)来说,它也不能完美地工作。不幸的是,它没有提供具有合理标准的自动选择机制,例如分辨率、日期或其他任何东西,自动选择似乎只是随机选择第一个找到的图像作为要保存的参考。删除许多图像可能会非常慢,因为它会尝试在每次删除时更新结果计数。 所有这三个工具都可以找到视觉上的重复项,而不仅仅是逐字节相同的文件。 John Lyon 2011-05-12T17:42:12+08:002011-05-12T17:42:12+08:00 FSlint fslint是一个图形程序,可以通过 md5sum 查找任何类型的重复文件。如果图像不相同,则不会将它们标记为重复。下图显示了我的下载目录中的一堆重复的 pdf 文件: 您可以更改高级搜索参数以按文件类型搜索并将自己限制为仅图像。这是通过将“额外查找参数”更改为find命令选项来完成的。例如,这里我只查找*.jpg文件(在同一路径中,只查看我的“Downloads”文件夹: fdupes fdupes是一个等效的基于命令行的工具。两者都可以在 repos 中找到。 dv3500ea 2010-09-13T10:21:38+08:002010-09-13T10:21:38+08:00 fdupes 您可以使用命令行工具fdupes来查找重复文件(man fdupes更多详细信息,请参阅)。我不知道有什么方法可以找到已调整大小的“重复项”。执行此操作的程序需要某种智能算法来分析图像内容,因为当调整图像大小时,其数据会发生变化,因此传统的重复查找方法将不起作用。 lofidevops 2011-12-14T00:56:57+08:002011-12-14T00:56:57+08:00 imgSeek imgSeek可以找到重复的图片以及相似的图片(因此它应该能够找到调整大小的照片以及具有不同文件名和元数据的照片),甚至可以根据草图搜索照片。它有桌面版和服务器版。 不过,我自己并没有真正尝试过。 tuxflo 2015-01-18T05:56:16+08:002015-01-18T05:56:16+08:00 dupeGuru 图片版效果非常好,值得一试。 他们有一个Launchpad PPA,dupeguru(新的多合一包)或dupeguru-pe(旧图片版包)可以使用这些命令从它安装: sudo add-apt-repository ppa:hsoft/ppa sudo apt-get update sudo apt-get install dupeguru the dsc 2013-08-22T19:02:28+08:002013-08-22T19:02:28+08:00 可视化 Visipics 是用于该功能的免费 Windows 应用程序,但通过 wine 在 Linux 上运行良好,当然(它比 geeqie/gqview 关于重复的排序更好(geeqie 的结果绝对“不可排序”))。 您可以告诉它根据较小的文件大小、非压缩类型、较低的分辨率等标准自动选择图像(但它不会做相反的事情,您需要手动进行,这不会是比在 geeqie 上做的要好得多,除了选择不需要按住Shift/ Ctrl),甚至优先考虑文件夹(但最后一个优先级是文件夹优先级)。 但是,您必须注意符号链接——它可以“随机”选择将符号链接保存到文件,同时将实际文件作为“副本”删除。真可惜。 Anirudh 2020-08-16T21:24:21+08:002020-08-16T21:24:21+08:00 我编写了这个 Python 脚本来查找视觉上相似的图像,并删除除了最大的图像之外的所有图像。 它在内部使用findimagedupes来查找重复的图像。 可以使用 -d 和 -r 选项为您的用例调用它,这将: 不删除(较小的视觉相似)文件。 输出一个“dups.txt”文件,该文件将包含重复的(准确的视觉相似)文件。 https://github.com/AnirudhKishan/DeleteVisuallyRedundant
数码相机
将所有照片添加到您的收藏中。在菜单中,选择工具/查找重复项。这将在您的整个收藏中查找重复项。
查找图像重复
一个命令行工具。在命令行上传递您要比较的所有图像。
Geeqie(原GQview)
在菜单中,选择File / Find duplicate。拖放图像文件做重复窗口。您可以删除目录以递归方式添加其内容。对于图像的视觉比较,下拉菜单上有特定的非默认选项。“自定义”相似度级别允许仅将配对限制为最高相似度,但必须在Preferences上进行设置如 99。即便如此,至少对于某些类型的图像(如线条艺术)来说,它也不能完美地工作。不幸的是,它没有提供具有合理标准的自动选择机制,例如分辨率、日期或其他任何东西,自动选择似乎只是随机选择第一个找到的图像作为要保存的参考。删除许多图像可能会非常慢,因为它会尝试在每次删除时更新结果计数。
所有这三个工具都可以找到视觉上的重复项,而不仅仅是逐字节相同的文件。
FSlint
fslint
是一个图形程序,可以通过 md5sum 查找任何类型的重复文件。如果图像不相同,则不会将它们标记为重复。下图显示了我的下载目录中的一堆重复的 pdf 文件:您可以更改高级搜索参数以按文件类型搜索并将自己限制为仅图像。这是通过将“额外查找参数”更改为
find
命令选项来完成的。例如,这里我只查找*.jpg
文件(在同一路径中,只查看我的“Downloads”文件夹:fdupes
fdupes
是一个等效的基于命令行的工具。两者都可以在 repos 中找到。fdupes
您可以使用命令行工具
fdupes
来查找重复文件(man fdupes
更多详细信息,请参阅)。我不知道有什么方法可以找到已调整大小的“重复项”。执行此操作的程序需要某种智能算法来分析图像内容,因为当调整图像大小时,其数据会发生变化,因此传统的重复查找方法将不起作用。imgSeek
imgSeek可以找到重复的图片以及相似的图片(因此它应该能够找到调整大小的照片以及具有不同文件名和元数据的照片),甚至可以根据草图搜索照片。它有桌面版和服务器版。
不过,我自己并没有真正尝试过。
dupeGuru 图片版效果非常好,值得一试。
他们有一个Launchpad PPA,
dupeguru
(新的多合一包)或dupeguru-pe
(旧图片版包)可以使用这些命令从它安装:可视化
Visipics 是用于该功能的免费 Windows 应用程序,但通过 wine 在 Linux 上运行良好,当然(它比 geeqie/gqview 关于重复的排序更好(geeqie 的结果绝对“不可排序”))。
您可以告诉它根据较小的文件大小、非压缩类型、较低的分辨率等标准自动选择图像(但它不会做相反的事情,您需要手动进行,这不会是比在 geeqie 上做的要好得多,除了选择不需要按住Shift/ Ctrl),甚至优先考虑文件夹(但最后一个优先级是文件夹优先级)。
但是,您必须注意符号链接——它可以“随机”选择将符号链接保存到文件,同时将实际文件作为“副本”删除。真可惜。
我编写了这个 Python 脚本来查找视觉上相似的图像,并删除除了最大的图像之外的所有图像。
它在内部使用findimagedupes来查找重复的图像。
可以使用 -d 和 -r 选项为您的用例调用它,这将:
https://github.com/AnirudhKishan/DeleteVisuallyRedundant