在非 root 用户上用 bash 替换 zsh

Question

Asked: 2021-06-27 11:02:07 +0800 CST2021-06-27 11:02:07 +0800 CST 2021-06-27 11:02:07 +0800 CST

使用同步输出运行后台（异步）cmd

772

我正在使用 curl 获取 URL，然后写入文件，如下所示：

urls=( 
  'https://www.example1.com'
  'https://www.example2.com'
 )

for i in ${urls[@]}; do
   curl $i &
done
echo 'stuff'

我特意简化了代码，因此可以解决确切的问题。

输出：

stuff
$curlContents1
$curlContents2

我知道为什么会发生这种情况，它是异步运行的。

我想知道的

我想运行这个异步 cmd，其输出与我同步运行它时的输出相同。
这是因为异步运行它可以提高速度

期望的输出：

$curlContents1
$curlContents2
stuff

更多信息

我的实际问题有点不同……

我正在做的是下载视频，然后获取 URL 的最后一部分并将其用作文件名，parallel在此示例中如何使用？

写入发生在下载之前，因为下载是最耗时的部分

arr=(
  'https://www.example1.com/stccdtu.mp4’
  'https://www.example2.com/dyubdf.mp4’
 )

for i in ${arr[@]}; do 
    curl $i > `echo $i | sed s'#https://www.example[0-9].com/##'g` &
done

输出：

ll

0 stccdtu.mp4 
0 dyubdf.mp4

2 个回答

Voted

Kamil Maciorowski · Answer 1 · 2021-06-27T11:58:04+08:00

使用 GNU parallel。基本示例：

parallel -j 40 --group --keep-order curl ::: "${urls[@]}"
echo 'stuff'

-j 40意味着我们分配了 40 个工作槽，即我们允许最多 40 个并行工作（根据您的需要和能力进行调整）。如果您提供更多 URL，则将在某个插槽可用后处理第 41 个 URL。所有 URL 都将被处理，但任何时候最多有 40 个作业并行运行。

使用的其他选项：

--group
组输出。每个作业的输出组合在一起，仅在命令完成时打印。Stdout（标准输出）首先是 stderr（标准错误）。[…]

^（来源）

这是默认设置，因此通常您不必显式使用它。

--keep-order
-k
保持输出顺序与输入顺序相同。通常，作业完成后将立即打印作业的输出。[...]-k只影响打印输出的顺序 - 而不是运行作业的顺序。

^（来源）

笔记：

在我的示例parallel中，它不在后台并且是同步运行的（所以echo在它之后运行）；仍然curl是并行、异步运行的。
在 Debian 中，GNUparallel位于一个名为parallel. 该工具的基本变体（来自moreutils，至少在 Debian 中）功能较弱。
parallel是外部命令。如果数组足够大，那么parallel … ::: "${urls[@]}"你会命中argument list too long. 改用这个：
```
printf '%s\n' "${urls[@]}" | parallel …
```
它将起作用，因为在 Bashprintf中是内置的，因此之前的所有内容|都由 Bash 在内部处理。
${urls[@]}被正确地双引号（在你的代码中${urls[@]}并且$i没有被引用，这是错误的）。

GNUparallel 可以调用导出的 Bash 函数。这使我们能够解决您所谓的实际问题：

getvideo() {
curl "$1" > "${1##*/}"
}
export -f getvideo

urls=(
  'https://www.example1.com/stccdtu.mp4'
  'https://www.example2.com/dyubdf.mp4'
 )

parallel -j 40 --group --keep-order getvideo ::: "${urls[@]}"
echo 'stuff'

如果您不知道是什么${1##*/}，请阅读我的另一个答案。

djones · Answer 2 · 2021-06-27T14:33:56+08:00

Bash shell 具有wait暂停脚本直到后台作业完成的命令。

等待由 ID 标识的每个进程，该 ID 可以是进程 ID 或作业规范，并报告其终止状态。 如果没有 给出 ID，则等待所有当前活动的子进程，返回状态为零。如果 ID 是作业规范，则等待该作业管道中的所有进程。

for i in ${urls[@]}; do
   curl $i &
done
wait
echo 'stuff'

使用同步输出运行后台（异步）cmd

输出：

我想知道的

期望的输出：

更多信息

输出：

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

使用同步输出运行后台（异步）cmd

输出：

我想知道的

期望的输出：

更多信息

输出：

2 个回答

相关问题