如何从断行符之前的段落中获取文本,例如:
<p align="right">
<font size="3">
ABC
<br/>
DEF
<br/>
FGH
<br/>
iJK
</font>
</p>
并保存在一个像这样的数组中:
text[0] = "ABC"
text[1] = "DEF"
text[2] = "iJK"
我目前正在使用:
paragraph_text = soup.find('p')
print paragraph_text.text
但这会给我一段的所有文字。
找到p
元素并遍历.stripped_strings
:
for text in soup.p.stripped_strings:
print(text)
印刷:
ABC
DEF
FGH
iJK
或者,如果您想要一个列表:
texts = list(soup.p.stripped_strings)
print(texts)
印刷:
['ABC', 'DEF', 'FGH', 'iJK']
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句