嗨,我正在尝试使用python中的硒抓取多个页面。我对提取属于span类元素的所有元素感兴趣,基本上我想做的是获取span类元素,然后提取其中的链接。对于每个页面,可以通过使用xpath来实现,但是xpath对于每个对象和每个页面都会更改。以下是网络元素外观的示例:
本质上,我想提取要在所有要抓取的页面中保持一致的元素。所以我的想法是先获取这些元素,然后再获取href元素。我尝试使用此代码获取页面上的所有元素
driver.find_elements_by_xpath("//span[@class='Text__StyledText-jknly0-0 cCEhaW']")
但是,这没有用,它什么也不返回。我也不想使用内部类,因为它也随页面而变化,因此,如果我想自动进行抓取而不会太混乱,则要使用的唯一实际元素是我提到的那个元素。有什么方法可以提取页面上此span类元素的链接?
试试这个xpath
//span[contains(@class,'Text__StyledText')]//a[contains(@class,'Anchor__StyledAnchor')]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句