AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 458212
Accepted
user3647558
user3647558
Asked: 2018-07-25 10:53:29 +0800 CST2018-07-25 10:53:29 +0800 CST 2018-07-25 10:53:29 +0800 CST

GNU 与 for 循环并行?

  • 772

我找到了接近这个的答案,但不明白如何在我的情况下使用它们(我对 Bash 很陌生)......所以,我正在尝试处理一个包含大图像序列的文件夹(100k + 文件)使用 Imagemagick 并希望使用 GNU Parallel 来加快速度。

这是我使用的代码(一次处理 100 帧以避免内存不足):

calcmethod1=mean;
allframes=(*.png)
cd out1

for (( i=0; i < "${#allframes[@]}" ; i+=100 )); do 
    convert "${allframes[@]:i:100}" -evaluate-sequence "$calcmethod1" \
        -channel RGB -normalize ../out2/"${allframes[i]}"
done

我将如何“并行化”这个?我发现大多数解决方案不使用循环而是使用管道 - 但是这样做我遇到了我的脚本会因为我的参数列表太长而中断的问题......

我想我想要做的是parallel拆分负载,例如将前 100 帧交给核心 1,将 100-199 帧交给核心 2 等等?

bash imagemagick
  • 3 3 个回答
  • 5134 Views

3 个回答

  • Voted
  1. eschwartz
    2018-07-25T11:40:34+08:002018-07-25T11:40:34+08:00

    正确的解决方案是使用内置的 shell 打印文件名,这样printf '%s\0' *.png不会受到命令行参数长度的 ARG_MAX 限制的影响,然后通过管道将parallel --null其读取这些文件名并根据需要批处理作业。

    parallel我们将使用的一些功能:

    • --null需要在空字符上合理拆分文件名,以防止奇怪的文件名出现奇怪的问题
    • -n 100就像 xargs 一样,每次调用都会处理 100 个文件
    • {}包含这 100 个文件名
    • ../out2/{1}仅包含第一个

    所以,这将变成:

    calcmethod1=mean
    printf '%s\0' *.png | parallel --null -n 100 convert {} -evaluate-sequence $calcmethod1 -channel RGB -normalize {} ../out2/{1}
    

    为什么你认为管道不起作用?管道工作正常,只有不从管道读取的外部分叉命令存在参数长度问题。管道实际上是parallel.

    • 3
  2. Best Answer
    slm
    2018-07-25T23:23:29+08:002018-07-25T23:23:29+08:00

    命令

    您的示例程序似乎并不关心您正在构建*.png的allframes数组的顺序,但您的评论让我相信顺序很重要。

    我想我想做的是并行拆分负载,例如将前 100 帧交给核心 1,将第 100-199 帧交给核心 2 等等?

    重击

    因此,我将从像这样修改您的脚本开始,更改allframes数组的结构,以便文件按数字顺序存储。

    allframes=($(printf "%s\n" *.png | sort -V | tr '\n' ' '))
    

    这可以进一步简化为sort -zV:

    allframes=($(printf "%s\0" *.png | sort -zV | tr '\0' ' '))
    

    这对构建您的convert ...命令有影响,因此它们现在看起来像这样:

    $ convert "0.png 1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png \
              10.png 11.png 12.png 13.png 14.png 15.png 16.png 17.png 18.png \
              19.png 20.png 21.png 22.png 23.png 24.png 25.png 26.png 27.png \
              28.png 29.png 30.png 31.png 32.png 33.png 34.png 35.png 36.png \
              37.png 38.png 39.png 40.png 41.png 42.png 43.png 44.png 45.png \
              46.png 47.png 48.png 49.png 50.png 51.png 52.png 53.png 54.png \
              55.png 56.png 57.png 58.png 59.png 60.png 61.png 62.png 63.png \
              64.png 65.png 66.png 67.png 68.png 69.png 70.png 71.png 72.png \
              73.png 74.png 75.png 76.png 77.png 78.png 79.png 80.png 81.png \
              82.png 83.png 84.png 85.png 86.png 87.png 88.png 89.png 90.png \
              91.png 92.png 93.png 94.png 95.png 96.png 97.png 98.png 99.png" \
              -evaluate-sequence "mean" -channel RGB -normalize ../out2/0.png
    

    平行线

    基于 eschwartz 的示例,我整理了一个parallel示例,如下所示:

    $ printf '%s\n' *.png | sort -V | parallel -n100 --dryrun convert {} \
       -evaluate-sequence 'mean' -channel RGB -normalize ../out2/{1}
    

    再次,更简单地使用sort -zV:

    $ printf '%s\0' *.png | sort -zV | parallel -0 -n100 --dryrun "convert {} \
       -evaluate-sequence 'mean' -channel RGB -normalize ../out2/{1}
    

    注意:上面有一个 echo "..." 作为parallel开始的动作。这样做有助于可视化正在发生的事情:

    $ convert 0.png 1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png \
             11.png 12.png 13.png 14.png 15.png 16.png 17.png 18.png 19.png \
             20.png 21.png 22.png 23.png 24.png 25.png 26.png 27.png 28.png \
             29.png 30.png 31.png 32.png 33.png 34.png 35.png 36.png 37.png \
             38.png 39.png 40.png 41.png 42.png 43.png 44.png 45.png 46.png \
             47.png 48.png 49.png 50.png 51.png 52.png 53.png 54.png 55.png \ 
             56.png 57.png 58.png 59.png 60.png 61.png 62.png 63.png 64.png \ 
             65.png 66.png 67.png 68.png 69.png 70.png 71.png 72.png 73.png \ 
             74.png 75.png 76.png 77.png 78.png 79.png 80.png 81.png 82.png \
             83.png 84.png 85.png 86.png 87.png 88.png 89.png 90.png 91.png \
             92.png 93.png 94.png 95.png 96.png 97.png 98.png 99.png \
             -evaluate-sequence mean -channel RGB -normalize ../out2/0.png
    

    如果您对此输出感到满意,只需将--dryrun开关移至parallel,然后重新运行即可。

    $ printf '%s\0' *.png | sort -zV | parallel -0 -n100 convert {} \ 
        -evaluate-sequence 'mean' -channel RGB -normalize
    

    参考

    • [发表于 Open Source For You (OSFY) 杂志,2013 年 10 月版。]
    • 3
  3. Bob
    2018-07-25T13:40:30+08:002018-07-25T13:40:30+08:00

    convert可以在自己的子 shell 中运行每个进程:

    #!/bin/bash
    
    for (( i=1; i<=1000; i++ )) do
    (
    command --options ) &
    disown
    done
    
    exit 0
    

    要查看它是如何工作的,请尝试以下脚本:

    #!/bin/bash
    
    echo "Hi!"
    
    for (( i=1; i<=1000; i++ )) do
    (
    sleep 30
    echo "Bye, "$i"!" ) &
    disown
    done
    
    exit 0
    

    分配给脚本名称par.sh并随后检查进程:

    ps aux | grep par.sh
    

    我们可以假设本机 Linux CPU 负载平衡器应该在 CPU 内核之间均匀分布进程,因为每个子 shell 都有一个单独的 pid。cpuset无论如何,总是可以使用类似的东西。

    • 2

相关问题

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 从文本文件传递变量的奇怪问题

  • 虽然行读取保持转义空间?

  • `tee` 和 `bash` 进程替换顺序

  • 运行一个非常慢的脚本直到它成功

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    ssh 无法协商:“找不到匹配的密码”,正在拒绝 cbc

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    如何卸载内核模块“nvidia-drm”?

    • 13 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add 返回:“连接代理时出错:没有这样的文件或目录” 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve