BeautifulSoup网页抓取，没有结果

debugcn 发表于 Dev

7777777777的

我正在尝试从https://hk.appledaily.com/search/apple抓取新闻信息。我需要从中获取新闻内容，div class="flex-feature"但它只会返回[]。希望任何人都能帮忙，谢谢！

from bs4 import BeautifulSoup
import requests


page = requests.get("https://hk.appledaily.com/search/apple")

soup = BeautifulSoup(page.content, 'lxml')

results = soup.find_all('div', class_ = "flex-feature")


print(results)

西藏人。一世

该页面上的数据是通过js动态获取和呈现的。因此，除非您评估javascript，否则将无法获取数据。

删除数据的一种方法是使用无头浏览器。
这是一个使用pyppeteer的例子。

import asyncio
from pyppeteer import launch

# https://pypi.org/project/pyppeteer/

URL = 'https://hk.appledaily.com/search/apple'

async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto(URL)

    await page.waitForSelector(".flex-feature")

    elements = await page.querySelectorAll('.flex-feature')
    
    for el in elements:
        text = await page.evaluate('(el) => el.textContent', el)
        print(text)


    await browser.close()

asyncio.get_event_loop().run_until_complete(main())

输出：

3小時前特朗普確診 不斷更新 特朗普新聞秘書及多名白宮職員確診 「白宮群組」持續擴大特朗普確診 不斷更新

 ... REDUCTED ...

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

没有id的网页抓取

来自分类Dev

Python BeautifulSoup 网页抓取：为什么 section 标签里面没有显示任何东西？

来自分类Dev

没有 SSL CERT 的网页抓取登录

来自分类Dev

使用BeautifulSoup抓取网页

来自分类Dev

使用 BeautifulSoup 抓取网页

来自分类Dev

Beautifulsoup 的网页抓取

来自分类Dev

BeautifulSoup 网页抓取错误

来自分类Dev

BeautifulSoup 网页抓取

来自分类Dev

网页源中没有网页抓取隐藏文本？

来自分类Dev

使用BeautifulSoup从网页的特定部分抓取所有图像

来自分类Dev

Python 网页抓取未使用 BeautifulSoup 显示所有行

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

用beautifulsoup进行网页抓取

来自分类Dev

网页抓取 Python (BeautifulSoup,Requests)

来自分类Dev

python beautifulsoup 网页抓取问题

来自分类Dev

使用 Beautifulsoup 抓取 UEFA 网页

来自分类Dev

Beautifulsoup - 抓取搜索结果

来自分类Dev

网页抓取后，cheerio没有得到回复

来自分类Dev

AttributeError: str 没有附加属性（网页抓取、链接）

来自分类Dev

使用 R 进行网页抓取 - 没有 HTML 可见

来自分类Dev

没有Node js的网页抓取可能吗？

来自分类Dev

从搜索结果页面BeautifulSoup抓取所有URL

来自分类Dev

使用BeautifulSoup使用Python抓取ASPX网页

来自分类Dev

Python BeautifulSoup从网页上抓取表格

来自分类Dev

使用BeautifulSoup从网页中抓取特定链接

来自分类Dev

如何使用BeautifulSoup抓取缺少标签的网页

来自分类Dev

使用 BeautifulSoup FindAll 进行网页抓取

来自分类Dev

如何使用 BeautifulSoup 进行网页抓取

Related 相关文章

文章