获取第一次命中的 url [webscraping python]

debugcn 发表于 Dev

萨宾

我有一堆谷歌查询，我想获取第一次点击的网址。

我的一段代码：

import requests

query = 'hello world'
url = 'http://google.com/search?q=' + query
page= requests.get(url)
print(url)

那么我想检索的是第一个谷歌点击的网站，在这种情况下，维基百科页面：https : //en.wikipedia.org/wiki/%22Hello,_World!%22_program

我有其余的代码，但我不知道如何检索 url。

哈尔

您可以使用 select_one 来限制第一个匹配。使用类 r 来限制结果。使用类和类型选择器比使用属性更快，这就是我使用rand 的原因a。

import requests
from bs4 import BeautifulSoup as bs
query = 'hello world'
url = 'http://google.com/search?q=' + query
page= requests.get(url)
soup = bs(page.content, 'lxml')
print(soup.select_one('.r a')['href'])

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-24

我来说两句

0条评论

登录后参与评论

来自分类Dev

使用Python datetime获取每天的第一次和最后一次时间

来自分类Dev

Cloudinary第一次尝试返回空URL

来自分类Dev

python熊猫第一次分组

来自分类Dev

python熊猫第一次分组

来自分类Dev

仅Python执行第一次打印

来自分类Dev

python webscraping问题

来自分类Dev

无法通过beautifulsoup webscraping python获取标签“ rel”

来自分类Dev

无法通过beautifulsoup webscraping python获取标签“ rel”

来自分类Dev

无法使用 Python WebScraping 从列表中获取所有标题

来自分类Dev

在Maya 2015中，如何获取python重新加载此模块？构造函数仅在第一次运行

来自分类Dev

Python-> Beautifulsoup-> Webscraping->遍历URL（1到53）并保存结果

来自分类Dev

ASP Core - jquery 总是从第一次点击的控件返回 data-url

来自分类Dev

使用 Shell 脚本在 URL 中查找 (/) 的第一次出现

来自分类Dev

在第二次执行时暂停函数的第一次执行（Python）

来自分类Dev

Python Webscraping Selenium弹出Youtube

来自分类Dev

使用 Python / Selenium 进行 WebScraping

来自分类Dev

为什么python程序第一次运行非常慢？

来自分类Dev

Python：将值分配给DataFrame中每个组的第一次观察

来自分类Dev

Python使用pandas.pivot_table每组进行第一次观察

来自分类Dev

Python PANDAS：第一次出现列值后删除所有行

来自分类Dev

Python的数据框 - 删除重复TRUE约会，除了第一次出现

来自分类Dev

第一次超时后，AWS Python Lambda永远超时

来自分类Dev

跳过对Python中模拟对象的第一次调用

来自分类Dev

Python Pandas：如何获得与第一次约会的天差

来自分类Dev

为什么python程序第一次运行非常慢？

来自分类Dev

如何获得第一次出现？正则表达式python

来自分类Dev

如何反复删除字符串中第一次出现的python？

来自分类Dev

Python / NumPy第一次出现被遮罩的子数组

来自分类Dev

Python，“如果第一次调用line，则执行其他操作”

Related 相关文章

文章