Python-获取段落文本(网页抓取)

塔拉·阿夫扎尔(M Talha Afzal)

如何从断行符之前的段落中获取文本,例如:

      <p align="right">
        <font size="3">
             ABC
         <br/>
             DEF
         <br/>
             FGH
         <br/>
             iJK
        </font>
      </p>

并保存在一个像这样的数组中:

text[0] = "ABC"
text[1] = "DEF"
text[2] = "iJK"

我目前正在使用:

paragraph_text = soup.find('p')
print paragraph_text.text

但这会给我一段的所有文字。

ec

找到p元素并遍历.stripped_strings

for text in soup.p.stripped_strings:
    print(text)

印刷:

ABC
DEF
FGH
iJK

或者,如果您想要一个列表:

texts = list(soup.p.stripped_strings)
print(texts)

印刷:

['ABC', 'DEF', 'FGH', 'iJK']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

网页抓取 - 从使用 BeautifulSoup 和 Python 的类中获取文本?

来自分类Dev

使用python 2.7从网页上抓取文本

来自分类Dev

使用 python 网页抓取获取 <span> 值

来自分类Dev

Python-Selenium-无法从HTML网页抓取特定文本内容

来自分类Dev

Python抓取-计算元素并获取文本

来自分类Dev

python BeautifulSoup无法从网页获取文本

来自分类Dev

网页抓取-Python

来自分类Dev

从网页抓取-python

来自分类Dev

网页抓取Python

来自分类Dev

从网页抓取-python

来自分类Dev

Python/硒网页抓取

来自分类Dev

Python 网页抓取登录

来自分类Dev

网页抓取获取文本到CSV文件

来自分类Dev

Python + scrapy + 网页抓取:页面未被抓取

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

使用Python进行网页抓取

来自分类Dev

使用BeautifulSoup Python抓取网页

来自分类Dev

Python网页抓取美丽汤

来自分类Dev

Python 网页抓取数据值?

来自分类Dev

网页抓取 Python (BeautifulSoup,Requests)

来自分类Dev

使用 BS 的 Python 网页抓取

来自分类Dev

python beautifulsoup 网页抓取问题

来自分类Dev

Python 抓取网页中的部分

来自分类Dev

网页抓取动态网页Python

来自分类Dev

python 3-硒-打印从网页上抓取的文本元素

来自分类Dev

从网页抓取中搜索文本并将接下来的4行转换为python数据框

来自分类Dev

用硒,漂亮的汤,Python进行网页抓取-找不到特定的文本

来自分类Dev

Python + 网页抓取 + scrapy:如何从 IMDb 页面获取所有电影的链接?

来自分类Dev

从网页上抓取数据-Python / Selenium