我正在尝试使用 BeautifulSoup 来查询网页,但遇到了一些问题。我打开了网页并阅读了 html,使用
html1 = urllib.request.urlopen(var).read()
soup = BeautifulSoup(html1,'html.parser')
当我打印汤时,我得到了一大堆文字,我想这是正常的......
我现在想做的是找到与我的目标相关的文本的特定部分。我注意到我感兴趣的部分(标签)以字母“br /”开头。
我添加了以下代码来尝试获取此“br /”中的文本:
tags1 = soup('br')
for tag in tags1:
tag.get('br', None)
print(tag)
但输出似乎只是标签本身,而不是这些标签内的文本。
对于如何获取该文本的任何建议,我将不胜感激。如果这是一个非常基本的问题,请道歉。
谢谢
要从标签中获取文本,请使用tag.text
:
found_tags = soup.find_all('br')
for tag in found_tags:
print(tag.text)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句