Java扫描程序查找标签,然后使用定界符将该标签中的内容写入文件

帕特里克·门杜斯|

我正在编写一个程序,该程序旨在搜索网站的HTML,查找特定标签,然后将该标签的内容写入文件。例如,HTML可能如下所示:

<div class="something" specific-tag:"print this 1">some content</div>
<div class="something" not-the-right-tag:"don't print this">some content</div>
<div class="something" specific-tag:"print this 2">some content</div>
<div class="something" not-the-right-tag:"don't print this">some content</div>
<div class="something" specific-tag:"print this 3">some content</div>

所需的文件输出如下所示:

print this 1
print this 2
print this 3

我知道如何使用Scanner类查找特定标签,在这种情况下为“ specific-tag”,并且我知道如何使用定界符将文件写入文件,在这种情况下,定界符为“,但是我不知道如何要做的就是搜索标签,然后在该标签后的定界符之间的所有内容都写入文件,然后继续搜索下一个标签并重复直到文件结束。

有什么想法吗?

马丁·博亚诺夫(Martin Boyanov)

您确实应该使用某种html解析库。谷歌快速搜索显示了该http://jsoup.org/似乎很容易使用。呼唤

Elements divs = doc.select("div[specific-tag]");

应该产生div,然后您可以提取specific-tag属性。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Java中的扫描程序的现有定界符中添加逗号?

来自分类Dev

扫描仪定界符无法与输入文件(Java)一起正常使用

来自分类Dev

在Java中使用扫描仪时,在令牌中包含定界符

来自分类Dev

如何使用定界符查找行尾?

来自分类Dev

在Java中读取具有多个定界符的文件

来自分类Dev

在Java中对.split使用多个定界符

来自分类Dev

如何使用Java消除Excel中的文本定界符

来自分类Dev

Java扫描仪定界符和System.in

来自分类Dev

如何使用扫描仪的定界符方法

来自分类Dev

Scanner Java混淆中的定界符

来自分类Dev

在c#中查找csv或文本文件的定界符

来自分类Dev

在定界符处分割文件,每个定界符后都有内容的文件扩展名

来自分类Dev

使用标准定界符将字符串修改为定义的输出模式,并用于分配值标签

来自分类Dev

从Java中的二进制文件读取时,如何检查空字节定界符?

来自分类Dev

在Java中读取具有多个定界符的文件行

来自分类Dev

使用定界符数组

来自分类Dev

使用定界符angularJS

来自分类Dev

使用多个定界符networkx / pandas从.txt文件中添加具有属性的节点

来自分类Dev

使用定界符在Powershell中拆分文件名

来自分类Dev

unix命令,使用定界符删除文本文件中的空格

来自分类Dev

BASH:仅在文件中的定界符之间搜索,而无需使用“剪切”

来自分类Dev

使用awk删除管道定界符文件中的前导零

来自分类Dev

使用定界符分割字符串,然后使用XSL将每个值存储在变量中

来自分类Dev

批处理文件中的定界符问题

来自分类Dev

字段定界符中的通配符-读取.csv文件

来自分类Dev

如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

来自分类Dev

如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

来自分类Dev

VB脚本使用定界符从文件中提取文本

来自分类Dev

使用Sed删除定界符之间的内容,但保留第一个定界符

Related 相关文章

  1. 1

    如何在Java中的扫描程序的现有定界符中添加逗号?

  2. 2

    扫描仪定界符无法与输入文件(Java)一起正常使用

  3. 3

    在Java中使用扫描仪时,在令牌中包含定界符

  4. 4

    如何使用定界符查找行尾?

  5. 5

    在Java中读取具有多个定界符的文件

  6. 6

    在Java中对.split使用多个定界符

  7. 7

    如何使用Java消除Excel中的文本定界符

  8. 8

    Java扫描仪定界符和System.in

  9. 9

    如何使用扫描仪的定界符方法

  10. 10

    Scanner Java混淆中的定界符

  11. 11

    在c#中查找csv或文本文件的定界符

  12. 12

    在定界符处分割文件,每个定界符后都有内容的文件扩展名

  13. 13

    使用标准定界符将字符串修改为定义的输出模式,并用于分配值标签

  14. 14

    从Java中的二进制文件读取时,如何检查空字节定界符?

  15. 15

    在Java中读取具有多个定界符的文件行

  16. 16

    使用定界符数组

  17. 17

    使用定界符angularJS

  18. 18

    使用多个定界符networkx / pandas从.txt文件中添加具有属性的节点

  19. 19

    使用定界符在Powershell中拆分文件名

  20. 20

    unix命令,使用定界符删除文本文件中的空格

  21. 21

    BASH:仅在文件中的定界符之间搜索,而无需使用“剪切”

  22. 22

    使用awk删除管道定界符文件中的前导零

  23. 23

    使用定界符分割字符串,然后使用XSL将每个值存储在变量中

  24. 24

    批处理文件中的定界符问题

  25. 25

    字段定界符中的通配符-读取.csv文件

  26. 26

    如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

  27. 27

    如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

  28. 28

    VB脚本使用定界符从文件中提取文本

  29. 29

    使用Sed删除定界符之间的内容,但保留第一个定界符

热门标签

归档