AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 558014
Accepted
SparedWhisle
SparedWhisle
Asked: 2019-12-20 00:13:40 +0800 CST2019-12-20 00:13:40 +0800 CST 2019-12-20 00:13:40 +0800 CST

限制 find 命令的匹配数

  • 772

如果我希望 find 命令在找到一定数量的匹配项后停止,我该怎么做?

背景是我在一个文件夹中有太多文件,我需要将它们随机放入单独的文件夹中,例如:

find -max-matches 1000 -exec mv {} /path/to/collection1 \+; 
find -max-matches 1000 -exec mv {} /path/to/collection2 \+; 

这可以find单独做吗?如果不是,那么最简单的方法是什么?

find
  • 5 5 个回答
  • 4902 Views

5 个回答

  • Voted
  1. Stephen Kitt
    2019-12-20T00:32:32+08:002019-12-20T00:32:32+08:00

    您可以实施新的find使用测试-exec:

    seq 1 1000 |
    find . -exec read \; -exec mv {} /path/to/collection1 +
    

    会将找到的前 1000 个文件移动到/path/to/collection1.

    这工作如下:

    • seq 1 1000输出 1000 行,通过管道传输到find;
    • -exec read读取一行,如果管道关闭则失败(当seq' 的输出已被消耗时);
    • 如果前一个-exec成功,则-exec mv ...执行移动。

    -exec ... +像您期望的那样工作:read每次迭代运行一次,但find会累积匹配的文件并mv尽可能少地调用。

    这依赖于基于执行命令的退出状态的find'成功或失败的事实:成功时,继续处理上面给出的操作(因为默认运算符是“and”),当它失败时,停止。-execreadfindfind

    如果您find支持该-quit操作,则可以使用它来提高效率:

    seq 1 1000 |
    find . \( -exec read \; -o -quit \) -exec mv {} /path/to/collection1 +
    

    没有它,find将测试每个文件,即使它只会保留 1000 个mv.

    我假设它read可以作为外部命令使用,并为;实现POSIX 规范。read如果不是这种情况,sh -c read可以改用。在这两种情况下,find都将为它检查的每个文件启动一个单独的进程。

    • 19
  2. Best Answer
    Kusalananda
    2019-12-20T00:39:46+08:002019-12-20T00:39:46+08:00

    由于除了遍历目录树之外您并没有使用find太多,我建议您直接使用 shell 来执行此操作。请参阅两者zsh及bash以下的变体。


    使用zsh外壳

    mv ./**/*(-.D[1,1000]) /path/to/collection1    # move first 1000 files
    mv ./**/*(-.D[1,1000]) /path/to/collection2    # move next 1000 files
    

    globbing 模式./**/*(-.D[1,1000])将匹配当前目录中或下的所有常规文件(或此类文件的符号链接),然后返回其中的第一个 1000。将-.匹配限制为常规文件或指向这些文件的符号链接,而D行为类似于dotglob(bash匹配隐藏名称)。

    这是假设在调用时通过扩展通配模式生成的命令不会变得太大mv。

    以上是非常低效的,因为它会扩展每个集合的全局。因此,您可能希望将路径名存储在数组中,然后移动其中的切片:

    pathnames=( ./**/*(-.D) )
    
    mv $pathnames[1,1000]    /path/to/collection1
    mv $pathnames[1001,2000] /path/to/collection2
    

    在创建数组时将其随机化pathnames(您提到要移动随机文件):

    pathnames=( ./**/*(-.Doe['REPLY=$RANDOM']) )
    

    您可以在 中做类似的事情bash(除了您不能轻易地将 glob 匹配的结果打乱bash,除了可能通过 提供结果shuf,所以我会跳过那一点):

    shopt -s globstar dotglob nullglob
    
    pathnames=()
    for pathname in ./**/*; do
        [[ -f $pathname ]] && pathnames+=( "$pathname" )
    done
    
    mv "${pathnames[@]:0:1000}"    /path/to/collection1
    mv "${pathnames[@]:1000:1000}" /path/to/collection2
    mv "${pathnames[@]:2000:1000}" /path/to/collection3
    
    • 18
  3. xenoid
    2019-12-20T00:26:18+08:002019-12-20T00:26:18+08:00

    我不认为它可以用 just 来完成find。你可以使用类似的东西:

    find [... your parameters ...] -print0 | head -z -1000 | xargs -0 mv -t /path/to/collection
    

    -print0, -z, 并-0共同确保一切正常,即使文件名中有换行符。

    • 11
  4. stk
    2019-12-20T00:29:49+08:002019-12-20T00:29:49+08:00

    我认为,直接使用 find 是不可能的,但是您可以使用带有 head 和 xargs 的管道,例如:

    找到... | 头-1000 | xargs -i mv "{} /path/to/collection1"

    这会将前 1000 个文件移动到 collection1。

    • 4
  5. Samuel Åslund
    2021-03-19T12:27:59+08:002021-03-19T12:27:59+08:00

    Stephens 回答 264963 可能最适合我的用例,但是对于这个问题的用例有一个简单的解决方法,只有 find 和 head:

    find . [checks] -print -exec ... | head
    

    将在(至少在 CentOS 8 上)-print之前进行评估,并且当关闭管道时,管道到头将导致退出。-execfindhead

    • 1

相关问题

  • 如果未引用 -name 后面的模式,则 find 的奇怪行为

  • 将变量从子shell打印到父shell [重复]

  • 检查某个文件夹是否存在于某个目录中

  • 从命令行查找和替换 CSS 文件中的颜色

  • GNU find:在-exec中获取绝对和相对路径

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve