我是Python的新手,因此对于任何愚蠢行为,请提前道歉。
我正在从网站上抓取信息,并正在使用.extract_first()提取元素。
我想要的输出只是元素的文本,即“ Bob Smith”。但是,相反,xpath似乎是围绕名称打印的:
相关代码:
sel = Selector(text=driver.page_source)
name = sel.xpath('//li[@class="inline t-24 t-black t-normal break-words"]').extract_first()
if name:
name = name.strip()
print(name)
输出:
'<li class="inline t-24 t-black t-normal break-words">\n Bob Smith\n </li>'
我尝试在线找到一种解决方案,但没有在extract_first()的上下文中找到解决此问题的解决方案。我如何摆脱xpath,使输出的只是元素文本?谢谢。
尝试使用
name = sel.xpath('normalize-space(//li[@class="inline t-24 t-black t-normal break-words"])').extract_first()
我在问题中的html输出:
鲍勃·史密斯
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句