我面临一个问题,我必须从子节点获取结果,该子节点可能是也可能不是使用scrapy的Xpath的某些其他节点的父节点。考虑这样的情况
<h1 class="main">
<span class="child">data</span>
</h1>
或者
<h1 class="main">
<span class="child">
<span class="child2">data</span>
</span>
</h1>
我的解决方案是 response.xpath(".//h1[@class='main']/span/text()").extract()
使用//text
,它将返回span范围内的列表中的所有文本元素,包括父级和子级:
response.xpath(".//h1[@class='main']/span//text()").extract()
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句