我在网上搜索了这个问题,并在堆栈交换中找到了一个有关问题的代码,该代码被誉为解决此问题的方法。但是,当我在终端中运行时,输出是这样的:
*Possible Dupes
Which dupe would you like to delete?
Enter # to delete or q to quit
#
./3: line 36: [: #: integer expression expected
./3: line 36: [: #: integer expression expected
./3: line 43: #: syntax error: operand expected (error token is "#")*
如果我没有它们的列表,我怎么知道“我想删除”哪个骗局?所以,对我来说根本没有解决办法。我不知道该怎么办。哦,“去读一些手册”没有帮助。
我有 3255 个文件需要筛选,我不想花几个小时从头到尾查看每个文件,我不想查找是否存在特定的重复项,而是想查找是否有任何文件名在第一个 X 中重复(可以1,2 或更多)字符,这样我就可以删除它们,无论是泡泡龙、凯撒、弹球梦还是其他什么。我想从 A 到 Z 的 3255 个文件中查找哪些文件在第一个字符中重复,并指定我要查找的字符数。
我不想重命名任何东西。
文件名示例:
Perfect General The (1991)(Ubisoft Entertainment).7z
Boulderdash 2 (1985)(First Star Software).7z
Bridge 7.0 (1992)(Artworx).7z
预期输出:
Bubble Bobble (1987)(Taito Corporation).7z
Bubble Bobble (1990)(Taito Corporation).7z
我不希望代码删除任何内容,我只是希望它为我找到相关文件。
代码:
#!/bin/bash
declare -a names
xIFS="${IFS}"
IFS="^M"
while true; do
awk -F'[-_ ]' '
NR==FNR {seen[tolower($1)]++; next}
seen[tolower($1)] > 1
' <(printf "%s\n" *.jar) <(printf "%s\n" *.jar) > tmp.dat
IDX=0
names=()
readarray names < tmp.dat
size=${#names[@]}
clear
printf '\nPossible Dupes\n'
for (( i=0; i<${size}; i++)); do
printf '%s\t%s' ${i} ${names[i]}
done
printf '\nWhich dupe would you like to delete?\nEnter # to delete or q to quit\n'
read n
if [ $n == 'q' ]; then
exit
fi
if [ $n -lt 0 ] || [ $n -gt $size ]; then
read -p "Invalid Option: present [ENTER] to try again" dummyvar
continue
fi
#clean the carriage return \n from the name
IFS='^M'
read -ra TARGET <<< "${names[$n]}"
unset IFS
# now remove the filename sans any carriage returns
# from the filesystem
# 12/18/2020
rm "${TARGET[*]}"
echo "removed ${TARGET[0]}" >> rm.log
done
IFS="${xIFS}"
在 Bash 中,您可以添加以下 shell 函数:
...并使用它来匹配前六个字符,通过调用它的名称
dupfind
并传递6
给它,如下例所示:或者从链接的帖子中稍微修改一下 AWK 脚本,您可以执行以下操作:
...其中
n=6
是要匹配的前缀字符的数量。请注意, AWK 解决方案虽然速度更快,但在处理包含换行符的文件名时会失败,而 shell 函数则不会。
然而, GNU AWK(不确定其他实现)确实支持将记录分隔符设置为 NULL 字符,这样就可以处理此类文件名,如下所示: