我使用 selenium 进行网页抓取:
from selenium import webdriver
path_to_chromedriver = '/usr/lib/chromium-browser/chromedriver'
browser = webdriver.Chrome(executable_path=path_to_chromedriver)
browser.get(url)
element = browser.find_element_by_id('email')
现在我有一个生成大量嵌套表的网站,并且似乎会自动分配 ID(可能不是每次都相同)。可靠的一件事是我感兴趣的表格有一个单元格
<td>My Content</td>
有没有类似下面的内容?
browser.find_element_by_text("<td>", text="My Content")
是的,您也可以找到具有文本匹配的元素:
contains()
xpath的使用方法:
browser.find_element_by_xpath("//td[contains(text(),'My Content')]")
它将定位与文本匹配的元素(我们可以将其用于部分匹配)
或者您可以使用以下text()
方法:
browser.find_element_by_xpath("//td[text()='My Content']")
在这里,您必须传递完整的字符串以进行匹配,包括空格。否则它不会工作
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句