在不知道所有属性的情况下从HTML标记中获取文本

皮耶特

我正在尝试通过以下链接爬网在Docker集线器中找到的所有存储库名称:https ://hub.docker.com/search/?q =*& page =1& isAutomated =0& isOfficial =1& pullCount =0& starCount =0

我感兴趣的HTML标签是:

<div class="RepositoryListItem__repoName___3iIWs" data-reactid=".s0zyncta0w.1.2.1.0.0.$4lexnz/overtime.0.0.1.0">4lexnz/overtime</div>

每个存储库的数据反应性总是不同的。

我正在使用Bash,并希望在每个包含class =“ RepositoryListItem__repoName ___ 3iIWs”的div的div标记之间添加文本。有人可以帮我构造一个regexp和命令链来用bash做到这一点吗?

到目前为止,我有:

content=$(curl -L 'https://hub.docker.com/search/?q=*&page=1&isAutomated=0&isOfficial=0&pullCount=0&starCount=0')
echo $content | grep -oP '(?<=<div class="RepositoryListItem__repoName___3iIWs").*?(?= </div>)'

但这根本不返回任何东西。$ content的值是正确的,因此这是最后的grep不能满足我的要求。有人可以帮忙吗?谢谢!

路卡

我认为您应该使用类似:

content=$(curl -L 'https://hub.docker.com/search/?q=*&page=1&isAutomated=0&isOfficial=0&pullCount=0&starCount=0')
echo $content | grep -oP '<div class="RepositoryListItem__repoName___3iIWs"\s(.)+?>(\K.+?)(?=<\/div>)'

对于我来说似乎很有效,这样您就可以提取出一个组,其中包含的确切位置是<div >and中的文本</div>

请注意,将RegEx与grep结合使用是我的新手,所以可能有些聪明,但这可以满足您的需求。\K标记会删除之前的所有匹配项,并且(?=)我会</div>从匹配项中删除该部分。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

是否可以在不知道属性名称的情况下选择SQL中的所有XML属性?

来自分类Dev

在不知道网页结构的情况下使用Scrapy抓取所有文本

来自分类Dev

如何在不知道元素的情况下循环所有XML属性

来自分类Dev

在不知道包含节点的情况下从组中删除所有子级

来自分类Dev

如何在不知道大小的情况下绘制matlab中的所有矩阵元素?

来自分类Dev

Delphi-JSON对象-如何在不知道属性名称的情况下迭代所有属性?

来自分类Dev

Selenium:如何在不知道其id或name属性的情况下找到网页上的所有图像?

来自分类Dev

如何在不知道 Javascript 中的 id 的情况下获取输入文本字段的值

来自分类Dev

在不知道目标类型的情况下使用Expression获取属性值

来自分类Dev

在不知道类名的情况下获取静态属性的值

来自分类Dev

在不知道类名的情况下获取静态属性的值

来自分类Dev

如何在不知道列表大小的情况下使用redis-cli打印列表中的所有值?

来自分类Dev

在不知道其名称的情况下打印所有POST请求参数

来自分类Dev

Javascript在不知道所有键的情况下访问多维数组

来自分类Dev

在不知道类型的情况下从文件中读取

来自分类Dev

在不知道树中位置的情况下找到属性

来自分类Dev

在不知道codeIgniter中的字段名的情况下获取数据

来自分类Dev

如何在不知道键的情况下使用 javascript 从多级 JSON 中获取值

来自分类Dev

SQL:在不知道所有列名的情况下,从联接中的一个表中选择所有值?

来自分类Dev

如何在不知道类型的情况下将表的所有子项返回到列表?

来自分类Dev

在不知道扩展名的情况下获取文件扩展名,没有模式

来自分类Dev

如何在不知道用户 ID 的情况下获取 firebase 用户发布的数据?甚至有可能吗?

来自分类Dev

如何在不知道其在Visual Studio中的位置的情况下使用SqlDataReader从选择中获取值

来自分类Dev

一种在不知道嵌套 js 对象中的路径的情况下访问属性的方法

来自分类Dev

在不知道这些属性名称的情况下访问对象的属性不起作用

来自分类Dev

如何在不知道元素名称的情况下获取xslt中节点的namespace-uri?

来自分类Dev

如何在不知道VB.NET中数字键名称的情况下从JSON获取值

来自分类Dev

如何在不知道名称的情况下获取JSONObject中的第一个对象?

来自分类Dev

在不知道ID的情况下隐藏/显示文本框及其标签

Related 相关文章

  1. 1

    是否可以在不知道属性名称的情况下选择SQL中的所有XML属性?

  2. 2

    在不知道网页结构的情况下使用Scrapy抓取所有文本

  3. 3

    如何在不知道元素的情况下循环所有XML属性

  4. 4

    在不知道包含节点的情况下从组中删除所有子级

  5. 5

    如何在不知道大小的情况下绘制matlab中的所有矩阵元素?

  6. 6

    Delphi-JSON对象-如何在不知道属性名称的情况下迭代所有属性?

  7. 7

    Selenium:如何在不知道其id或name属性的情况下找到网页上的所有图像?

  8. 8

    如何在不知道 Javascript 中的 id 的情况下获取输入文本字段的值

  9. 9

    在不知道目标类型的情况下使用Expression获取属性值

  10. 10

    在不知道类名的情况下获取静态属性的值

  11. 11

    在不知道类名的情况下获取静态属性的值

  12. 12

    如何在不知道列表大小的情况下使用redis-cli打印列表中的所有值?

  13. 13

    在不知道其名称的情况下打印所有POST请求参数

  14. 14

    Javascript在不知道所有键的情况下访问多维数组

  15. 15

    在不知道类型的情况下从文件中读取

  16. 16

    在不知道树中位置的情况下找到属性

  17. 17

    在不知道codeIgniter中的字段名的情况下获取数据

  18. 18

    如何在不知道键的情况下使用 javascript 从多级 JSON 中获取值

  19. 19

    SQL:在不知道所有列名的情况下,从联接中的一个表中选择所有值?

  20. 20

    如何在不知道类型的情况下将表的所有子项返回到列表?

  21. 21

    在不知道扩展名的情况下获取文件扩展名,没有模式

  22. 22

    如何在不知道用户 ID 的情况下获取 firebase 用户发布的数据?甚至有可能吗?

  23. 23

    如何在不知道其在Visual Studio中的位置的情况下使用SqlDataReader从选择中获取值

  24. 24

    一种在不知道嵌套 js 对象中的路径的情况下访问属性的方法

  25. 25

    在不知道这些属性名称的情况下访问对象的属性不起作用

  26. 26

    如何在不知道元素名称的情况下获取xslt中节点的namespace-uri?

  27. 27

    如何在不知道VB.NET中数字键名称的情况下从JSON获取值

  28. 28

    如何在不知道名称的情况下获取JSONObject中的第一个对象?

  29. 29

    在不知道ID的情况下隐藏/显示文本框及其标签

热门标签

归档