我目前正在学习网页抓取功能,遇到了漂亮的肥皂模块问题。我运行了以下代码:
import requests, bs4
res = requests.get('http://www.weather.gov/')
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, "html.parser")
comicElem = soup.find('#topnews p')
print (len(comicElem))
当我运行时,它显示结果,但也显示标签以及它在哪个元素中。喜欢:
如何隐藏段落标签?有什么不同的方法吗?请检查您的解决方案并回答。
事实:我使用python 3.5,Windows 7
使用.get_text()
以获取元素的内部文本:
comicElem.get_text()
请注意,如果有多个元素,则需要get_text()
为每个元素调用:
[elm.get_text() for elm in soup.find_all('#topnews p')]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句