如果未引用 -name 后面的模式，则 find 的奇怪行为

Question

SparedWhisle

Asked: 2019-12-20 00:13:40 +0800 CST2019-12-20 00:13:40 +0800 CST 2019-12-20 00:13:40 +0800 CST

限制 find 命令的匹配数

772

如果我希望 find 命令在找到一定数量的匹配项后停止，我该怎么做？

背景是我在一个文件夹中有太多文件，我需要将它们随机放入单独的文件夹中，例如：

find -max-matches 1000 -exec mv {} /path/to/collection1 \+; 
find -max-matches 1000 -exec mv {} /path/to/collection2 \+;

这可以find单独做吗？如果不是，那么最简单的方法是什么？

5 个回答

Voted

Stephen Kitt · Answer 1 · 2019-12-20T00:32:32+08:00

您可以实施新的find使用测试-exec：

seq 1 1000 |
find . -exec read \; -exec mv {} /path/to/collection1 +

会将找到的前 1000 个文件移动到/path/to/collection1.

这工作如下：

seq 1 1000输出 1000 行，通过管道传输到find;
-exec read读取一行，如果管道关闭则失败（当seq' 的输出已被消耗时）；
如果前一个-exec成功，则-exec mv ...执行移动。

-exec ... +像您期望的那样工作：read每次迭代运行一次，但find会累积匹配的文件并mv尽可能少地调用。

这依赖于基于执行命令的退出状态的find'成功或失败的事实：成功时，继续处理上面给出的操作（因为默认运算符是“and”），当它失败时，停止。-execreadfindfind

如果您find支持该-quit操作，则可以使用它来提高效率：

seq 1 1000 |
find . \( -exec read \; -o -quit \) -exec mv {} /path/to/collection1 +

没有它，find将测试每个文件，即使它只会保留 1000 个mv.

我假设它read可以作为外部命令使用，并为;实现POSIX 规范。read如果不是这种情况，sh -c read可以改用。在这两种情况下，find都将为它检查的每个文件启动一个单独的进程。

Kusalananda · Answer 2 · 2019-12-20T00:39:46+08:00

由于除了遍历目录树之外您并没有使用find太多，我建议您直接使用 shell 来执行此操作。请参阅两者zsh及bash以下的变体。

使用zsh外壳

mv ./**/*(-.D[1,1000]) /path/to/collection1    # move first 1000 files
mv ./**/*(-.D[1,1000]) /path/to/collection2    # move next 1000 files

globbing 模式./**/*(-.D[1,1000])将匹配当前目录中或下的所有常规文件（或此类文件的符号链接），然后返回其中的第一个 1000。将-.匹配限制为常规文件或指向这些文件的符号链接，而D行为类似于dotglob（bash匹配隐藏名称）。

这是假设在调用时通过扩展通配模式生成的命令不会变得太大mv。

以上是非常低效的，因为它会扩展每个集合的全局。因此，您可能希望将路径名存储在数组中，然后移动其中的切片：

pathnames=( ./**/*(-.D) )

mv $pathnames[1,1000]    /path/to/collection1
mv $pathnames[1001,2000] /path/to/collection2

在创建数组时将其随机化pathnames（您提到要移动随机文件）：

pathnames=( ./**/*(-.Doe['REPLY=$RANDOM']) )

您可以在中做类似的事情bash（除了您不能轻易地将 glob 匹配的结果打乱bash，除了可能通过提供结果shuf，所以我会跳过那一点）：

shopt -s globstar dotglob nullglob

pathnames=()
for pathname in ./**/*; do
    [[ -f $pathname ]] && pathnames+=( "$pathname" )
done

mv "${pathnames[@]:0:1000}"    /path/to/collection1
mv "${pathnames[@]:1000:1000}" /path/to/collection2
mv "${pathnames[@]:2000:1000}" /path/to/collection3

xenoid · Answer 3 · 2019-12-20T00:26:18+08:00

xenoid

2019-12-20T00:26:18+08:002019-12-20T00:26:18+08:00

我不认为它可以用 just 来完成find。你可以使用类似的东西：

find [... your parameters ...] -print0 | head -z -1000 | xargs -0 mv -t /path/to/collection

-print0, -z, 并-0共同确保一切正常，即使文件名中有换行符。

11

stk · Answer 4 · 2019-12-20T00:29:49+08:00

stk

2019-12-20T00:29:49+08:002019-12-20T00:29:49+08:00

我认为，直接使用 find 是不可能的，但是您可以使用带有 head 和 xargs 的管道，例如：

找到... | 头-1000 | xargs -i mv "{} /path/to/collection1"

这会将前 1000 个文件移动到 collection1。

4

Samuel Åslund · Answer 5 · 2021-03-19T12:27:59+08:00

Samuel Åslund

2021-03-19T12:27:59+08:002021-03-19T12:27:59+08:00

Stephens 回答 264963 可能最适合我的用例，但是对于这个问题的用例有一个简单的解决方法，只有 find 和 head：

find . [checks] -print -exec ... | head

将在（至少在 CentOS 8 上）-print之前进行评估，并且当关闭管道时，管道到头将导致退出。-execfindhead

1

限制 find 命令的匹配数

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

限制 find 命令的匹配数

5 个回答

相关问题