我有一堆谷歌查询,我想获取第一次点击的网址。
我的一段代码:
import requests
query = 'hello world'
url = 'http://google.com/search?q=' + query
page= requests.get(url)
print(url)
那么我想检索的是第一个谷歌点击的网站,在这种情况下,维基百科页面:https : //en.wikipedia.org/wiki/%22Hello,_World!%22_program
我有其余的代码,但我不知道如何检索 url。
您可以使用 select_one 来限制第一个匹配。使用类 r 来限制结果。使用类和类型选择器比使用属性更快,这就是我使用r
and 的原因a
。
import requests
from bs4 import BeautifulSoup as bs
query = 'hello world'
url = 'http://google.com/search?q=' + query
page= requests.get(url)
soup = bs(page.content, 'lxml')
print(soup.select_one('.r a')['href'])
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句