AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1719323
Accepted
user979974
user979974
Asked: 2022-05-05 00:45:47 +0800 CST2022-05-05 00:45:47 +0800 CST 2022-05-05 00:45:47 +0800 CST

Linux如何将嵌套子目录中的n个文件从一个目录移动到另一个目录

  • 772

我有一个invasive/包含 60000 个文件的目录。我只想将嵌套子目录中的 1000 个文件invasive/从invasive2/

我尝试执行以下操作: find invasive/ -type f -exec mv --backup=numbered -t invasive2/ {} + | head -1000

不幸的是,它确实有效。任何想法 ?

linux file-transfer
  • 2 2 个回答
  • 55 Views

2 个回答

  • Voted
  1. Marco
    2022-05-05T05:38:33+08:002022-05-05T05:38:33+08:00

    您必须对输出执行head命令find。像这样的东西(在具有非常有价值的数据的生产环境中,请密集测试)

    find invasive/ -type f -print0 | head -z -n 1000 | xargs -0 -r -n 1 mv --backup=numbered -t invasive2
    

    更新:

    评论完全正确。我总是忘记像换行符这样的“特殊字符”。我添加了“零终止”。感谢您的评论!

    见man xargs:

    • -n 1表示每个命令一个参数
    • -r表示如果为空则不运行
    • -0表示传入的参数以零 ( \0)结尾

    见man head:

    • -z表示传入的参数以零 ( \0)结尾

    见man find:

    • -print0表示以零结束传出字符串 ( \0)
    • 2
  2. Best Answer
    Kamil Maciorowski
    2022-05-06T12:00:01+08:002022-05-06T12:00:01+08:00

    分析

    在您的尝试中:

    find invasive/ -type f -exec mv --backup=numbered -t invasive2/ {} + | head -1000
    

    head根本没有输入,因为find不打印任何东西。

    如果你做了

    find … -print -exec mv … {} + | head …
    

    或者

    find … -exec mv … {} + -print | head …
    

    然后head会得到一些输入和退出,find可以得到SIGPIPE;但一般来说,信号不会在你需要的时候准确发生。这是因为-exec … {} +用{}可能的许多路径名替换,一堆路径名。

    • 如果… -print -exec … -print许多路径名首先发生行为,这些路径名将形成一堆-exec … {} +. 如果SIGPIPE发生,则-exec不会为该组执行。

    • 如果… -exec … {} + -print -exec首先对整个组执行操作,则只有-print分别为每个路径名打印。SIGPIPE只有当工具打印一些东西时才会发生,所以它不能中断-exec mv,它只能中断-print。如果SIGPIPE发生,它将阻止find打印更多路径名;但-exec mv …已经发生在整个一群人身上。

    您只想计算成功的移动操作。如果mv尝试移动多个文件并成功,则您知道所有文件都已移动。如果失败,那么您将无法轻松知道移动了多少文件。出于这个原因,您需要mv为每个要移动的文件单独设置一个文件。所以你需要-exec mv … \;而不是-exec mv … {} +(除了-exec … {} +作为测试find无论如何都没有用,它总是返回true)。

    另一个复杂因素是您不能确定-print每个文件只打印一行(因为路径名可能包含换行符)。一个可靠的解决方案是-printf '\n'(如果您find支持-printf)或-exec printf '\n' \;.

    这导致我们得到以下解决方案(虽然有缺陷):

    # flawed
    find invasive/ -type f -exec mv --backup=numbered -t invasive2/ {} \; -printf '\n' \
    | head -n 999 >/dev/null
    

    理论上它是这样工作的:

    • 当且仅当mv成功时,才会打印换行符。
    • head在 999 次换行之后终止,即在 999 次成功的移动操作之后。唯一的消失head不会导致find立即接收SIGPIPE。经过 999 次成功的移动操作head已不再存在,但find仍然有效。
    • find仅当它在终止SIGPIPE后尝试打印某些内容时才会收到。head这发生在第 1000 次成功的移动操作之后。

    在实践中,不能保证head读取速度足够快并且终止速度足够快以SIGPIPE准确地在我们需要它时引起。这是上面代码中的缺陷。find和之间有一个缓冲区head。它可能会find设法打印比head指示阅读更多的行。管道的机制旨在最终终止前面的工具(此处:)find,而不是精确地在确切的时刻;当我们想要在 1000 次成功的移动操作之后中断我们的操作时,我们不能依赖它。find

    以这种方式中继输出head并没有缺陷。就像是

    find … -print | head -n 1000 | code_that_runs_mv
    

    是一个好的开始,但由于路径名通常可能包含换行符,因此您需要-print0(不可移植)、head -z(也不可移植)等等。如果你想计算成功的移动操作,那么它应该是:

    find … -print0 | code0_that_runs_mv_and_counts
    

    code0_that_runs_mv_and_counts至少在 Bash 中,可以将其构建为 shell 脚本。我的尝试如下。


    解决方案

    find invasive/ -type f -print0 | bash -c '
       counter=1000
       while [ "$counter" -gt 0 ] && IFS= read -r -d "" pathname; do
          </dev/tty mv --backup=numbered -t invasive2/ "$pathname" && ((counter--))
       done
    ' code0_that_runs_mv_and_counts
    

    注意我曾经</dev/tty mv …阻止mv使用标准输入,以防它提示确认或其他内容。好吧,--backup=numbered我想它不应该提示;但总的来说它可能而且我们不希望它从我们的find.

    上面的代码不可移植,我不太喜欢它。


    便携式*解决方案

    如果您find不支持-print0或无法使用bash(或者您只是喜欢更多可移植代码),请考虑以下方法:

    while :; do echo; done | head -n 999 | find invasive/ -type f -exec sh -c '
       for pathname do
          </dev/tty mv --backup=numbered -t invasive2/ "$pathname" \
          && { read dummy || { kill -s PIPE "$PPID"; exit 0; } }
       done
    ' find-sh {} +
    

    * AFAIK 这里唯一不可移植的是您mv使用的选项。如果您不使用,那么我们可以将其重写为可移植形式。我添加的所有东西都是可移植的,这就是为什么我称这个解决方案为可移植的。--backup=numberedmv

    这就是代码的工作方式:

    • find启动sh并可能将许多路径名作为参数传递给它。可能不止一个sh开始一个接一个,数量无所谓。

    • sh尝试mv在循环中一一归档。成功移动操作后,它会尝试read从继承自find.

    • while … | head -n 999(可以是yes | head -n 999,但yes不可移植)恰好生成 999 行。除非我们先用完文件,否则正好 999reads会成功。第read1000 次成功的移动操作将是第一个read失败的操作。

    • 失败read恰好在第 1000 次成功移动操作之后发生。它会导致两件事:

      • find( $PPID, ) 的父进程sh得到SIGPIPE,因此不会启动更多sh进程;
      • 当前sh退出,因此它不会处理更多路径名。

    笔记

    • 所有片段都旨在移动 1000 个文件;有些包含1000,有些包含999在代码中。您可以调整它们以移动 N 个文件,但请注意代码中是否需要 N 或 N-1。

    • 计算成功的移动操作是有道理的,但在某些情况下,它可能会导致潜在的问题。在文件系统之间移动文件时,mv创建一个副本,然后删除源。删除失败会导致mv报告非零退出状态,但副本仍然存在。想象一下,您对您invasive/来说是只读的。在这种情况下,我们的代码会将常规文件复制到其中,invasive2/但不会mv被视为成功。将复制所有常规文件。

    • 我用过bash -c '…' code0_that_runs_mv_and_counts,find … -exec sh -c '…' find-sh {} +。如果您对争论感到惊讶code0_that_runs_mv_and_counts并find-sh成为争论,那么请阅读What is the second sh in sh -c 'some shell code' sh?

    • 1

相关问题

  • 对于 cp 或 mv,是否有等同于 cd - 的东西?

  • 以 root 身份运行 docker 容器

  • 如何在域和 Linux 活动目录中启用指纹传感器

  • 如何在CentOS 7 中将Ctrl+C 永久更改为Ctrl+K?

  • 为什么我不能将文件从 Android 发送到 Windows 10?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    v15 为什么通过电缆(同轴电缆)的千兆位/秒 Internet 连接不能像光纤一样提供对称速度? 2020-01-25 08:53:31 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve