有一个 HTML 标签 =
<nav-categories id="MainMenu" :json-data="{some data}">text</nav-categories>
我需要选取内容“:json-data”标准方法(response.css('::attr(":json-data")')
或response.css('::attr("\:json-data")')
)不会导致成功......我使用Python + Scrapy(response.selector)
有一个 HTML 标签 =
<nav-categories id="MainMenu" :json-data="{some data}">text</nav-categories>
我需要选取内容“:json-data”标准方法(response.css('::attr(":json-data")')
或response.css('::attr("\:json-data")')
)不会导致成功......我使用Python + Scrapy(response.selector)
Scrapy依赖于 lxml,因此
lxml
在答案中使用了 scrapy。XPath 不允许在表达式中使用冒号,但能够计算元素/属性名称。
使用
name()
XPath 函数作为解决方法:毕竟这是一个这样的选择: