scrapy:从选择器中提取属性

毛罗·詹蒂莱

我很抱歉初学者的问题,但这让我发疯:

想象一下,我将这个选择器用于一组 span 元素:

ori=response.xpath("//div[@class='comparison- 
  row']//div[contains(@class,'modern- 
  translation')]//span[contains(@class,'line-mapping')]")

我需要从每个跨度中提取 2 个属性,即数据 ID 和文本

我做:

for r in ori:
    id_n=r.xpath("@data-id").extract()
    text_n=r.xpath("/text()").extract()
    if len(id_n)!=0 and len(text_n)!=0:
       ids.append(id_n)
       text.append(text_n)

但以下返回错误:

text_n=r.xpath("/text()").extract()

我试过了:

for r in ori:
    n=r.extract()
    print(n) 

我有这个输出:

我会待在家里,祈求上帝保佑你的努力。明天离开,并确保这一点:我可以帮助你的任何事情,你都会拥有。 

我需要提取每个文本

一个陌生人

您需要使您的 xpath 表达式相对于当前元素:

text_n = r.xpath("./text()").extract()

另外,if len(id_n)!=0 and len(text_n)!=0:最好写成if id_n and text_n:

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从Scrapy选择器中提取原始HTML?

来自分类Dev

从属性选择器中提取值

来自分类Dev

从日期选择器中提取日期

来自分类Dev

Scrapy:尝试从选择器列表中提取数据不正确

来自分类Dev

如何从CSS选择器中提取类名?

来自分类Dev

Scrapy-使用选择器提取嵌套链接

来自分类Dev

使用CSS选择器或xpath提取scrapy数据

来自分类Dev

Scrapy 不提取数据,css 选择器是正确的

来自分类Dev

Scrapy CSS 选择器

来自分类Dev

如何从此Less代码中提取重复选择器?

来自分类Dev

使用rvest和CSS选择器从抓取的搜索结果中提取表

来自分类Dev

如何从TestCafe选择器中提取基础HTML dom元素?

来自分类Dev

如何使用CSS选择器从类中提取子字符串?

来自分类Dev

如何从此Less代码中提取重复选择器?

来自分类Dev

使用css选择器从html页面中提取信息

来自分类Dev

属性选择器的行为

来自分类Dev

CSS 属性选择器以

来自分类Dev

Scrapy中的嵌套选择器

来自分类Dev

XPath或CSS选择器-Scrapy

来自分类Dev

如何使用scrapy re()选择器?

来自分类Dev

Scrapy:如何获得正确的选择器

来自分类Dev

Scrapy - CSS 选择器问题

来自分类Dev

将类选择器与属性选择器组合

来自分类Dev

jQuery选择器属性范围

来自分类Dev

jQuery属性选择器问题

来自分类Dev

打字稿属性选择器

来自分类Dev

在CSS属性选择器中分组

来自分类Dev

CSS组合属性选择器

来自分类Dev

CSS:“同步”选择器属性