使用BeautifulSoup遍历并检索特定的URL

林爱德

我想使用BeautifulSoup并在特定位置重复检索特定的URL。您可能会想像有4个不同的URL列表,每个列表包含100个不同的URL链接。

我需要始终在每个列表上获取并打印第三个URL,而先前的URL(例如,第一个列表上的第三个URL)将导致第二个列表(然后需要获取并打印第三个URL,依此类推,直到第四次检索)。

但是,我的循环仅获得第一个结果(列表1中的第三个URL),而且我不知道如何将新URL循环回到while循环并继续该过程。

这是我的代码:

import urllib.request
import json
import ssl
from bs4 import BeautifulSoup


num=int(input('enter count times: ' ))
position=int(input('enter position: ' ))

url='https://pr4e.dr-chuck.com/tsugi/mod/python-   
data/data/known_by_Fikret.html'
print (url)

count=0
order=0
while count<num:
    context = ssl._create_unverified_context()
    htm=urllib.request.urlopen(url, context=context).read()
    soup=BeautifulSoup(htm)
    for i in soup.find_all('a'):
        order+=1
        if order ==position:
            x=i.get('href')
            print (x)
    count+=1
    url=x        
print ('done')
ec

只需find_all()按索引获取链接

while count < num:
    context = ssl._create_unverified_context()
    htm = urllib.request.urlopen(url, context=context).read()

    soup = BeautifulSoup(htm)
    url = soup.find_all('a')[position].get('href')

    count += 1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用CSS选择器使用BeautifulSoup检索某个类中的特定链接?

来自分类Dev

使用BeautifulSoup遍历XML以提取特定标签并存储在变量中

来自分类Dev

使用BeautifulSoup / Python遍历DOM

来自分类Dev

使用WorkerPool遍历URL列表

来自分类Dev

使用BeautifulSoup遍历列表并创建XML标签

来自分类Dev

使用BeautifulSoup遍历整个表格

来自分类Dev

使用BeautifulSoup遍历整个表吗?

来自分类Dev

使用BeautifulSoup遍历URL列表进行Web抓取

来自分类Dev

无法使用BeautifulSoup检索所需XPATH的元素

来自分类Dev

如何使用Beautifulsoup检索<th> <td>

来自分类Dev

使用BeautifulSoup根据属性检索信息

来自分类Dev

如何在Beautifulsoup 4中检索包含特定文本的href?

来自分类Dev

使用BeautifulSoup和RegEx或Lambda遍历URL以进行匹配?

来自分类Dev

使用BeautifulSoup查找特定文本

来自分类Dev

使用Tweepy检索特定的对话

来自分类Dev

使用BeautifulSoup从跨度部分检索值

来自分类Dev

使用beautifulSoup检索html标签内容

来自分类Dev

使用BeautifulSoup刮取不同的URL和特定行

来自分类Dev

使用BeautifulSoup遍历XML以提取特定标签并存储在变量中

来自分类Dev

使用BeautifulSoup查找特定文本

来自分类Dev

使用适用于Android的AWS Mobile SDK检索具有特定访问权限的图像URL

来自分类Dev

使用BeautifulSoup遍历列表并创建XML标签

来自分类Dev

使用BeautifulSoup遍历HTML标签

来自分类Dev

使用BeautifulSoup抓取特定网站

来自分类Dev

使用 BeautifulSoup 检索图像链接

来自分类Dev

无法使用 BeautifulSoup 检索 href

来自分类Dev

使用beautifulsoup困难检索信息

来自分类Dev

无法使用 BeautifulSoup 检索页面内容

来自分类Dev

使用 Javascript 检索 AppScript 的 URL

Related 相关文章

热门标签

归档