这个问题已经被问过多次,并在以下位置编译了很好的答案
从使用 JavaScript 的网站将数据抓取到 Google Sheets,
但我找不到解决我的问题的有效答案。
这Xpath
在浏览器中有效:
//td[1]//span[contains(@class,"cluster")]/text()
截图:
但是,Google 表格将导入的内容返回为空:
jQuery:
从使用 JavaScript 答案和引用问题的网站上抓取数据到 Google 表格,
它似乎IMPORTXML
无法用来解决我的问题,因为该页面加载了 jQuery。
正确的是Xpath
,我不知道还能尝试什么。
从这个答案scrap table using google app script看来Google Apps Script
可以使用一个解决方案。
这种方法仍然有效吗?
或者现在有人可以建议一个更简单的吗?
鉴于该网址:
https://www.onelook.com/thesaurus/?s=active
从这些答案看来,解析json
可能是一个更简单的解决方案,但是我没有json
通过使用开发人员工具网络选项卡进行搜索找到可用的文件(仅此网址可用):
从您的以下回复来看,
我明白你想从 URL 的表中检索每个单词,如 On"、"alive"、"existent"、"existing"。
当我看到你的 URL 时,该表似乎是由 Javascript 创建的。遗憾的是,在这种情况下,无法使用 IMPORTXML 和 Google Apps 脚本直接检索该表。但幸运的是,似乎可以通过其他 URL 检索创建表的数据。而且,看起来数据是 JSON 数据。在这种情况下,在这个答案中,我想提出一个示例脚本,用于使用 Google Apps 脚本检索您的期望值。那么,下面的示例脚本怎么样?
示例脚本:
["active","on","alive","existent","existing","dynamic","hyperactive",,,]
将显示在日志中。我认为这些值可能是您的期望值。笔记:
当您想要检索电子表格上的表格时,以下示例脚本怎么样?
当将此脚本用作自定义函数时,会得到以下结果。看来这与 HTML 表的值相同。