raylight Asked: 2021-03-04 22:22:26 +0800 CST2021-03-04 22:22:26 +0800 CST 2021-03-04 22:22:26 +0800 CST 如何从终端下载包含 JavaScript 生成内容的 HTML 网页? 772 在谷歌浏览器上,当我们进入开发模式时,right-click一个 HTML 元素 →复制→复制元素,我们可以复制网页的 HTML 内容。以下是我描述的过程的示例: 我的问题是,当我wget用于下载网页时,我得到了页面的源代码,包括它的 JavaScript 地址和脚本。 我想使用命令行下载页面的最终 HTML 结果,就像 Google Chrome 在我的示例中所做的那样。获取页面上显示的 HTML 内容对于我自动从网页中提取信息很有用。 是否可以使用wget或其他命令行工具下载页面的 HTML(不是源代码)? command-line 1 个回答 Voted Best Answer Raffa 2021-03-05T01:19:39+08:002021-03-05T01:19:39+08:00 由于您已经安装了Google Chrome,您可以通过在终端中运行来获取网页的内部 HTML 结构: google-chrome --headless --dump-dom 'URL' > ~/file.html 替换URL为所需网页的 URL。页面的HTML DOM将保存到file.html您的主目录中命名的文件中。
由于您已经安装了Google Chrome,您可以通过在终端中运行来获取网页的内部 HTML 结构:
替换
URL
为所需网页的 URL。页面的HTML DOM将保存到file.html
您的主目录中命名的文件中。