Python-获取段落文本（网页抓取）

debugcn 发表于 Dev

塔拉·阿夫扎尔（M Talha Afzal）

如何从断行符之前的段落中获取文本，例如：

      <p align="right">
        <font size="3">
             ABC
         <br/>
             DEF
         <br/>
             FGH
         <br/>
             iJK
        </font>
      </p>

并保存在一个像这样的数组中：

text[0] = "ABC"
text[1] = "DEF"
text[2] = "iJK"

我目前正在使用：

paragraph_text = soup.find('p')
print paragraph_text.text

但这会给我一段的所有文字。

找到p元素并遍历.stripped_strings：

for text in soup.p.stripped_strings:
    print(text)

印刷：

ABC
DEF
FGH
iJK

或者，如果您想要一个列表：

texts = list(soup.p.stripped_strings)
print(texts)

印刷：

['ABC', 'DEF', 'FGH', 'iJK']

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-17

我来说两句

0条评论

登录后参与评论

来自分类Dev

网页抓取 - 从使用 BeautifulSoup 和 Python 的类中获取文本？

来自分类Dev

使用python 2.7从网页上抓取文本

来自分类Dev

使用 python 网页抓取获取 <span> 值

来自分类Dev

Python-Selenium-无法从HTML网页抓取特定文本内容

来自分类Dev

Python抓取-计算元素并获取文本

来自分类Dev

python BeautifulSoup无法从网页获取文本

来自分类Dev

网页抓取-Python

来自分类Dev

从网页抓取-python

来自分类Dev

网页抓取Python

来自分类Dev

从网页抓取-python

来自分类Dev

Python/硒网页抓取

来自分类Dev

Python 网页抓取登录

来自分类Dev

网页抓取获取文本到CSV文件

来自分类Dev

Python + scrapy + 网页抓取：页面未被抓取

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

使用Python进行网页抓取

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

Python网页抓取美丽汤

来自分类Dev

Python 网页抓取数据值？

来自分类Dev

网页抓取 Python (BeautifulSoup,Requests)

来自分类Dev

使用 BS 的 Python 网页抓取

来自分类Dev

python beautifulsoup 网页抓取问题

来自分类Dev

Python 抓取网页中的部分

来自分类Dev

网页抓取动态网页Python

来自分类Dev

python 3-硒-打印从网页上抓取的文本元素

来自分类Dev

从网页抓取中搜索文本并将接下来的4行转换为python数据框

来自分类Dev

用硒，漂亮的汤，Python进行网页抓取-找不到特定的文本

来自分类Dev

Python + 网页抓取 + scrapy：如何从 IMDb 页面获取所有电影的链接？

来自分类Dev

从网页上抓取数据-Python / Selenium

Related 相关文章

文章