BeautifulSoup并未找到所有标签

Alberto Gonzalez占位符图像

我正在学习如何使用python 3.8中的BeautifulSoup抓取网络,我遇到了一个找不到解决方案的问题。

我正在尝试从此页面获取每种产品的品牌:

https://www.linio.com.mx/c/computacion/pc-portatil

有68种产品,而我只能得到60种,我确定我的脚本没有抢到第一款和最后一款产品,分别是ASUS A540和Lenovo Ideapad L340。

这是我的剧本

from urllib.request import urlopen
from bs4 import BeautifulSoup as soup


my_url = 'https://www.linio.com.mx/c/computacion/pc-portatil'



uClient = urlopen(my_url)
page_html = uClient.read()
uClient.close()


soup_page = soup(page_html, 'html.parser')

containers = soup_page.find(id="catalogue-product-container").findAll(True, recursive=False)


for container in containers:


    try:
        print(container.a.find(itemprop="brand")["content"])

    except TypeError:
        pass
fendy3d

在我看来,HTML解析器并不是完美的,有些人面临着与您相似的问题-Beautiful Soup findAll并没有全部找到他们

我运行了您的代码,但遇到了同样的问题。该错误已经在'find'和'findAll'方法上发生过-根据首页,似乎出于某种未知原因,我只提取赞助产品

您是否尝试过硒?根据我的经验,与其他Web抓取库相比,Selenium为我减少了麻烦,并为我节省了很多时间。但那只是我的个人意见。:)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

BeautifulSoup抓取未找到所有'a'标签

来自分类Dev

替换未找到所有匹配项

来自分类Dev

查找未找到所有文件

来自分类Dev

sh:所有命令“未找到”

来自分类Dev

Beautifulsoup如何找到所有工作

来自分类Dev

带有图标的Android标签页,未找到类

来自分类Dev

查找未找到应有的所有文件

来自分类Dev

重定向dotvvm中所有未找到的路由

来自分类Dev

SignTool错误:未找到符合所有给定条件的证书

来自分类Dev

在nginx上所有“未找到” Laravel路线

来自分类Dev

未找到所有 cv2 函数

来自分类Dev

Lucene.Net:搜索未找到所有值

来自分类Dev

在哪里声明 Angular 捕获所有(未找到)路线

来自分类Dev

尽管满足了所有要求,但未找到 DSL implementation()

来自分类Dev

获取除标签列表之外的所有标签 BeautifulSoup

来自分类Dev

Genymotion并未显示所有API版本

来自分类Dev

Javascript:getElementsByClassName并未提供所有元素

来自分类Dev

Beautifulsoup,在htm中找到唯一没有属性的标签

来自分类Dev

Beautifulsoup 找到没有值的标签和属性?

来自分类Dev

BeautifulSoup 没有找到所有的“th”

来自分类Dev

BeautifulSoup 没有显示标签中的所有元素

来自分类Dev

TFS2015构建在所有未找到“文件未找到”的命令行命令上失败

来自分类Dev

无法提取文字并通过BeautifulSoup找到所有内容

来自分类Dev

BeautifulSoup 在 Imgur 上找到所有图片链接

来自分类Dev

BeautifulSoup 找到 div > span > a 中的所有 title 和 href

来自分类Dev

BeautifulSoup找不到所有的div标签

来自分类Dev

BeautifulSoup,我如何拔出不在标签中的所有实例

来自分类Dev

从列表理解中获取 beautifulsoup 标签中的所有链接

来自分类Dev

WooCommerce类别/标签存档-“未找到产品”

Related 相关文章

  1. 1

    BeautifulSoup抓取未找到所有'a'标签

  2. 2

    替换未找到所有匹配项

  3. 3

    查找未找到所有文件

  4. 4

    sh:所有命令“未找到”

  5. 5

    Beautifulsoup如何找到所有工作

  6. 6

    带有图标的Android标签页,未找到类

  7. 7

    查找未找到应有的所有文件

  8. 8

    重定向dotvvm中所有未找到的路由

  9. 9

    SignTool错误:未找到符合所有给定条件的证书

  10. 10

    在nginx上所有“未找到” Laravel路线

  11. 11

    未找到所有 cv2 函数

  12. 12

    Lucene.Net:搜索未找到所有值

  13. 13

    在哪里声明 Angular 捕获所有(未找到)路线

  14. 14

    尽管满足了所有要求,但未找到 DSL implementation()

  15. 15

    获取除标签列表之外的所有标签 BeautifulSoup

  16. 16

    Genymotion并未显示所有API版本

  17. 17

    Javascript:getElementsByClassName并未提供所有元素

  18. 18

    Beautifulsoup,在htm中找到唯一没有属性的标签

  19. 19

    Beautifulsoup 找到没有值的标签和属性?

  20. 20

    BeautifulSoup 没有找到所有的“th”

  21. 21

    BeautifulSoup 没有显示标签中的所有元素

  22. 22

    TFS2015构建在所有未找到“文件未找到”的命令行命令上失败

  23. 23

    无法提取文字并通过BeautifulSoup找到所有内容

  24. 24

    BeautifulSoup 在 Imgur 上找到所有图片链接

  25. 25

    BeautifulSoup 找到 div > span > a 中的所有 title 和 href

  26. 26

    BeautifulSoup找不到所有的div标签

  27. 27

    BeautifulSoup,我如何拔出不在标签中的所有实例

  28. 28

    从列表理解中获取 beautifulsoup 标签中的所有链接

  29. 29

    WooCommerce类别/标签存档-“未找到产品”

热门标签

归档