我在几个带有子文件夹的文件夹中约有 250,000 个文件。寻找解决方案如何在所有文件夹及其子文件夹中查找重复的文件名。我的操作系统是 Ubuntu 22.04,使用bash
.
我更喜欢bash
命令/脚本解决方案。但是,也欢迎有关类似工具的建议fdupes -r
(但检查文件名是否相同,而不是其内容)。
关于文件及其名称:
- 所有文件都是图像并具有文件扩展名。
- 文件的内容并不重要,并且可能有所不同。
- 文件的扩展名并不重要,并且可能不同。
- 文件名及其扩展名的字母大小写不一致。
.
有些文件的文件名中包含多个(句点)。例子:file_Name2.1.png
- 文件扩展名是 3 或 4 个符号。例子:
.png
,.JPG
,.jpeg
结构:
目录结构非常简单:./[YEAR]/[MONTH]/[IMAGE_NAME].[EXTENSION]
. 例如:
tree -a
.
├── 2022
│ └── 12
│ ├── file1.png
│ └── File2.png
└── 2023
├── 01
│ ├── file1.jpg
│ ├── file3.png
│ └── file4.png
└── 02
├── FILE1.png
├── FILE4.PNG
├── File5.png
└── File6.png
预期结果:
file1
:./2022/12/file1.png ./2023/01/file1.jpg ./2023/02/FILE1.png
file4
:./2023/01/file4.png ./2023/02/FILE4.PNG
假设你的路径:
你可以使用类似的东西: