通过命令的标准输出以编程方式导出环境变量[重复]

Question

Rick T

Asked: 2019-12-10 12:17:50 +0800 CST2019-12-10 12:17:50 +0800 CST 2019-12-10 12:17:50 +0800 CST

无头铬浏览器命令语法问题

772

我遇到了一些关于无头铬浏览器没有正确创建 html 文件的问题。唯一创建的东西/文件是单个{}.html文件

我的 domain.txt 包含：

https://ibm.com/ 
https://www.linux.org/whats-new/

PS：我使用的是 Ubuntu 18.04 64bit linux

我使用的命令如下：

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

这是取自此链接

1 个回答

Voted

Kusalananda · Answer 1 · 2019-12-10T12:30:16+08:00

编码：

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

这缺少围绕sh -c. 通过正确的引用，它还会将代码从注入sh -c脚本xargs，这是一个安全漏洞。

管道写得更好

xargs -I {} -P 4 sh -c '
    timeout 25s chromium-browser \
        --headless --no-sandbox \
        --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36" \
        --dump-dom \
        "https://$1" 2>/dev/null >"$1.html"' sh {} <domains.txt

https://ibm.com/.html...但请注意，如果您在文件中有这些字符串（即写入奇怪命名的子目录中的文件），它仍然会写入称为事物的domains.txt文件，并且它将尝试获取诸如https://https://ibm.com/.

我认为目的是在文件中只保留实际的域，而不是完整的 URL domains.txt，即

ibm.com
www.linux.org

就个人而言，我宁愿使用更简单的解决方案curl。

无头铬浏览器命令语法问题

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

无头铬浏览器命令语法问题

1 个回答

相关问题