在Beautiful Soup中定位没有标签的文本元素

凯娃161

我正在尝试定位bs4没有相关标签的日期

HTML的结构为:

<div class="story-postdate">
  <div class="label-inline">Published</div>
  Feb 6, 2020, 4:40 pm SGT
</div>

我尝试过.findAll(attrs={'class' : 'story-postdate'}),然后尝试使用sibling选择器。但是没有喜悦。

我还尝试将其定位.text在CSS选择器的末尾。但这仍然返回一个无对象类型。

大兵搜

尝试这个

from bs4 import BeautifulSoup
from simplified_scrapy import SimplifiedDoc
html = """<div class="story-postdate">
  <div class="label-inline">Published</div>
  Feb 6, 2020, 4:40 pm SGT
</div>"""

# using BeautifulSoup
soup = BeautifulSoup(html,features='lxml')
print (soup.find('div',attrs={'class' : 'story-postdate'}).div.next_sibling)

# using SimplifiedDoc
doc  = SimplifiedDoc(html)
print (doc.select('div.story-postdate>div').nextText())

以下是SimplifiedDoc库的更多示例:https : //github.com/yiyedata/simplified-scrapy-demo/tree/master/doc_examples

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

查找带有特定文本的<td>标签值(Beautiful Soup)

来自分类Dev

如何使用Beautiful Soup拉没有属性的<p>标签?

来自分类Dev

如何使用Beautiful Soup从HTML提取特定的脚本元素

来自分类Dev

使用 Beautiful Soup Python 获取没有属性的跨度文本

来自分类Dev

Beautiful Soup 没有显示正确的网址

来自分类Dev

如何在Beautiful Soup中复制元素?

来自分类Dev

Beautiful Soup 在子元素中查找 href

来自分类Dev

Webscraping的Beautiful Soup问题

来自分类Dev

当有多个相似标签时,使用 Beautiful Soup 从特定 HTML 标签中提取文本

来自分类Dev

无法使用Python的Beautiful Soup从特定的span标签提取文本

来自分类Dev

Beautiful Soup - 提取包含随机标记标签的完整文本句子

来自分类Dev

使用beautiful-soup提取特定标签的元素

来自分类Dev

如何在获取Beautiful Soup元素的.string时忽略标签?

来自分类Dev

使用Beautiful Soup提取href元素内的特定psuedo标签

来自分类Dev

使用页面文本通过“ Beautiful Soup”选择“ html”元素

来自分类Dev

使用Beautiful Soup获取所有HTML标签

来自分类Dev

如何用Beautiful Soup忽略空标签?

来自分类Dev

如何使用Beautiful Soup来<script>标签?

来自分类Dev

如何用Beautiful Soup忽略空标签?

来自分类Dev

使用Beautiful Soup提取嵌套在多个标签中的文本— Python

来自分类Dev

使用未包含在标签中的find_next _siblings / text提取Beautiful Soup跳过的文本

来自分类Dev

如何使用Beautiful Soup在Python中的span标签内抓取文本

来自分类Dev

Beautiful Soup返回包装在<div>标签中的元素。我如何剥离它们?

来自分类Dev

如何在Beautiful Soup中的标签上使用if语句?

来自分类Dev

如何使用Beautiful Soup从HTML获取文本

来自分类Dev

使用Beautiful Soup获取<td>元素

来自分类Dev

AttributeError:'NoneType'对象没有属性'findChildren'(Beautiful Soup)

来自分类Dev

如何在Beautiful Soup的href中剪贴文本?

来自分类Dev

Python Beautiful Soup-基于HTML中的文本寻找价值

Related 相关文章

  1. 1

    查找带有特定文本的<td>标签值(Beautiful Soup)

  2. 2

    如何使用Beautiful Soup拉没有属性的<p>标签?

  3. 3

    如何使用Beautiful Soup从HTML提取特定的脚本元素

  4. 4

    使用 Beautiful Soup Python 获取没有属性的跨度文本

  5. 5

    Beautiful Soup 没有显示正确的网址

  6. 6

    如何在Beautiful Soup中复制元素?

  7. 7

    Beautiful Soup 在子元素中查找 href

  8. 8

    Webscraping的Beautiful Soup问题

  9. 9

    当有多个相似标签时,使用 Beautiful Soup 从特定 HTML 标签中提取文本

  10. 10

    无法使用Python的Beautiful Soup从特定的span标签提取文本

  11. 11

    Beautiful Soup - 提取包含随机标记标签的完整文本句子

  12. 12

    使用beautiful-soup提取特定标签的元素

  13. 13

    如何在获取Beautiful Soup元素的.string时忽略标签?

  14. 14

    使用Beautiful Soup提取href元素内的特定psuedo标签

  15. 15

    使用页面文本通过“ Beautiful Soup”选择“ html”元素

  16. 16

    使用Beautiful Soup获取所有HTML标签

  17. 17

    如何用Beautiful Soup忽略空标签?

  18. 18

    如何使用Beautiful Soup来<script>标签?

  19. 19

    如何用Beautiful Soup忽略空标签?

  20. 20

    使用Beautiful Soup提取嵌套在多个标签中的文本— Python

  21. 21

    使用未包含在标签中的find_next _siblings / text提取Beautiful Soup跳过的文本

  22. 22

    如何使用Beautiful Soup在Python中的span标签内抓取文本

  23. 23

    Beautiful Soup返回包装在<div>标签中的元素。我如何剥离它们?

  24. 24

    如何在Beautiful Soup中的标签上使用if语句?

  25. 25

    如何使用Beautiful Soup从HTML获取文本

  26. 26

    使用Beautiful Soup获取<td>元素

  27. 27

    AttributeError:'NoneType'对象没有属性'findChildren'(Beautiful Soup)

  28. 28

    如何在Beautiful Soup的href中剪贴文本?

  29. 29

    Python Beautiful Soup-基于HTML中的文本寻找价值

热门标签

归档