我正在尝试从此站点https://brokercheck.finra.org/search/genericsearch/list的搜索结果中抓取所有CRD#
(单击链接时,您需要重做搜索,只需为Individual
搜索键入一些随机内容)
我driver.find_elements_by_xpath
用来定位每个结果页面上的所有CRD编号。但是,我已经尝试了一段时间,但是Webdriver仍然无法从站点获取CRD。
我目前(在Python中)
crds = driver.find_elements_by_xpath("//md-list-item/div/div/div/div/div/bc-bio-geo-section/div/div/div/div/div/span")
但是结果总是空的。
要使用Selenium打印CRD#
来自网站https://brokercheck.finra.org/search/genericsearch/grid的搜索结果中的所有结果,您必须诱导使用WebDriverWait,并且可以使用以下两种定位策略之一:visibility_of_all_elements_located()
使用CSS_SELECTOR
和get_attribute()
:
print([my_elem.get_attribute("innerHTML") for my_elem in WebDriverWait(driver, 10).until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR, "span.ng-binding[ng-bind-html='vm.item.id']")))])
使用XPATH和text:
print([my_elem.text for my_elem in WebDriverWait(driver, 10).until(EC.visibility_of_all_elements_located((By.XPATH, "//span[starts-with(., 'CRD')]//following-sibling::span[1]")))])
注意:您必须添加以下导入:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句