通过命令的标准输出以编程方式导出环境变量[重复]

Question

acgbox

Asked: 2019-08-31 12:27:18 +0800 CST2019-08-31 12:27:18 +0800 CST 2019-08-31 12:27:18 +0800 CST

使用 Bash 脚本启动多个查询

772

我有以下 bash 脚本（在这篇文章中）：

#!/bin/bash
while read LINE; do
  curl -o /dev/null --silent --head --write-out "%{http_code} $LINE\n" "$LINE"
done < infile > outfile

文件：

google.com
facebook.com

输出文件：

301 amazon.com
302 facebook.com

问题：它非常慢，因为它逐行验证。

测试：我已经尝试过其他替代方案，例如fping（考虑到列表的大小非常有限）、pyfunceble（冻结）、wget、GNU parallel等。没有人说服我。这是一个带有xargs的解决方案，但输出与原始脚本不同

问题：如何使用此脚本启动多个查询（并行处理），以便我可以同时处理多行（如果可以手动设置要处理的行数，避免冻结或阻塞脚本或个人电脑）？

更新：解决了！谢谢

cat infile | xargs -I {} -P3 curl {} -o /dev/null --silent --head --write-out "%{http_code} {}\n" > outfile

PD：“-P 3”实例数

2 个回答

Voted

Ole Tange · Answer 1 · 2019-09-07T12:59:46+08:00

Best Answer

Ole Tange

2019-09-07T12:59:46+08:002019-09-07T12:59:46+08:00

由于https://mywiki.wooledge.org/BashPitfalls#Non-atomic_writes_with_xargs_-P（并行作业的输出xargs存在混合风险），我会改用 GNU Parallel：

cat infile |
  parallel -P0 -q curl {} -o /dev/null --silent --head --write-out "%{http_code} {}\n" > outfile

在这种特殊情况下，使用它可能是安全的，xargs因为输出很短，所以使用的问题xargs在于，如果以后有人更改代码以做更大的事情，它将不再安全。或者，如果有人阅读了这个问题并认为他可以curl用其他东西代替，那么这也可能不安全。

这可能会更快：

doit() {
  while read LINE; do
    curl -o /dev/null --silent --head --write-out "%{http_code} $LINE\n" "$LINE"
  done
}
export -f doit
parallel -j0 --pipepart -a infile --block -10 doit > outfile

2

mifritscher · Answer 2 · 2019-08-31T14:30:30+08:00

mifritscher

2019-08-31T14:30:30+08:002019-08-31T14:30:30+08:00

您可以将您的 url 列表分成 10 个部分并使用主脚本 ala

./subscript1.sh &
./subscript2.sh &
...
./subscript10.sh &

并行运行它。注意：他们应该使用不同的日志文件。

0

使用 Bash 脚本启动多个查询

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

使用 Bash 脚本启动多个查询

2 个回答

相关问题