搜索

搜索

BeautifulSoup并未找到所有标签

debugcn 发表于 Dev

19

Alberto Gonzalez占位符图像

我正在学习如何使用python 3.8中的BeautifulSoup抓取网络，我遇到了一个找不到解决方案的问题。

我正在尝试从此页面获取每种产品的品牌：

https://www.linio.com.mx/c/computacion/pc-portatil

有68种产品，而我只能得到60种，我确定我的脚本没有抢到第一款和最后一款产品，分别是ASUS A540和Lenovo Ideapad L340。

这是我的剧本

from urllib.request import urlopen
from bs4 import BeautifulSoup as soup


my_url = 'https://www.linio.com.mx/c/computacion/pc-portatil'



uClient = urlopen(my_url)
page_html = uClient.read()
uClient.close()


soup_page = soup(page_html, 'html.parser')

containers = soup_page.find(id="catalogue-product-container").findAll(True, recursive=False)


for container in containers:


    try:
        print(container.a.find(itemprop="brand")["content"])

    except TypeError:
        pass

fendy3d

在我看来，HTML解析器并不是完美的，有些人面临着与您相似的问题-Beautiful Soup findAll并没有全部找到他们。

我运行了您的代码，但遇到了同样的问题。该错误已经在'find'和'findAll'方法上发生过-根据首页，似乎出于某种未知原因，我只提取了赞助产品。

您是否尝试过硒？根据我的经验，与其他Web抓取库相比，Selenium为我减少了麻烦，并为我节省了很多时间。但那只是我的个人意见。:)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

BeautifulSoup抓取未找到所有'a'标签

来自分类Dev

替换未找到所有匹配项

来自分类Dev

查找未找到所有文件

来自分类Dev

sh：所有命令“未找到”

来自分类Dev

Beautifulsoup如何找到所有工作

来自分类Dev

带有图标的Android标签页，未找到类

来自分类Dev

查找未找到应有的所有文件

来自分类Dev

重定向dotvvm中所有未找到的路由

来自分类Dev

SignTool错误：未找到符合所有给定条件的证书

来自分类Dev

在nginx上所有“未找到” Laravel路线

来自分类Dev

未找到所有 cv2 函数

来自分类Dev

Lucene.Net：搜索未找到所有值

来自分类Dev

在哪里声明 Angular 捕获所有（未找到）路线

来自分类Dev

尽管满足了所有要求，但未找到 DSL implementation()

来自分类Dev

获取除标签列表之外的所有标签 BeautifulSoup

来自分类Dev

Genymotion并未显示所有API版本

来自分类Dev

Javascript：getElementsByClassName并未提供所有元素

来自分类Dev

Beautifulsoup，在htm中找到唯一没有属性的标签

来自分类Dev

Beautifulsoup 找到没有值的标签和属性？

来自分类Dev

BeautifulSoup 没有找到所有的“th”

来自分类Dev

BeautifulSoup 没有显示标签中的所有元素

来自分类Dev

TFS2015构建在所有未找到“文件未找到”的命令行命令上失败

来自分类Dev

无法提取文字并通过BeautifulSoup找到所有内容

来自分类Dev

BeautifulSoup 在 Imgur 上找到所有图片链接

来自分类Dev

BeautifulSoup 找到 div > span > a 中的所有 title 和 href

来自分类Dev

BeautifulSoup找不到所有的div标签

来自分类Dev

BeautifulSoup，我如何拔出不在标签中的所有实例

来自分类Dev

从列表理解中获取 beautifulsoup 标签中的所有链接

来自分类Dev

WooCommerce类别/标签存档-“未找到产品”

Related 相关文章

文章

热门标签

归档