我正在尝试使用python beautifulsoup从Indeed中提取br标签中的公司名称。
HTML代码:
<p> <h2 class="jobTitle"> <a href="viewjob?jk=1544ab41b4dc02b6" rel="nofollow"> Data Scientist </a> </h2> <br/> Deloitte - <span class="location"> Los Angeles, CA 90013 </span> <br/> <span class="date"> 1 day ago </span> </p>
我尝试了以下代码,但没有任何结果。
companies=soup.find_all('br')
for company in companies:
print(company.text)
您可以链接next_sibling
from bs4 import BeautifulSoup as bs
import requests
r = requests.get('https://www.indeed.com/m/jobs?q=data+scientist&l=Los+Angeles%2C+CA')
soup = bs(r.content, 'lxml')
for job in soup.select('.jobTitle'):
print(job.next_sibling.next_sibling)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句