Java扫描程序查找标签，然后使用定界符将该标签中的内容写入文件

debugcn 发表于 Dev

帕特里克·门杜斯|

我正在编写一个程序，该程序旨在搜索网站的HTML，查找特定标签，然后将该标签的内容写入文件。例如，HTML可能如下所示：

<div class="something" specific-tag:"print this 1">some content</div>
<div class="something" not-the-right-tag:"don't print this">some content</div>
<div class="something" specific-tag:"print this 2">some content</div>
<div class="something" not-the-right-tag:"don't print this">some content</div>
<div class="something" specific-tag:"print this 3">some content</div>

所需的文件输出如下所示：

print this 1
print this 2
print this 3

我知道如何使用Scanner类查找特定标签，在这种情况下为“ specific-tag”，并且我知道如何使用定界符将文件写入文件，在这种情况下，定界符为“，但是我不知道如何要做的就是搜索标签，然后在该标签后的定界符之间的所有内容都写入文件，然后继续搜索下一个标签并重复直到文件结束。

有什么想法吗？

马丁·博亚诺夫（Martin Boyanov）

您确实应该使用某种html解析库。谷歌快速搜索显示了该http://jsoup.org/。似乎很容易使用。呼唤

Elements divs = doc.select("div[specific-tag]");

应该产生div，然后您可以提取specific-tag属性。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-11

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何在Java中的扫描程序的现有定界符中添加逗号？

来自分类Dev

扫描仪定界符无法与输入文件（Java）一起正常使用

来自分类Dev

在Java中使用扫描仪时，在令牌中包含定界符

来自分类Dev

如何使用定界符查找行尾？

来自分类Dev

在Java中读取具有多个定界符的文件

来自分类Dev

在Java中对.split使用多个定界符

来自分类Dev

如何使用Java消除Excel中的文本定界符

来自分类Dev

Java扫描仪定界符和System.in

来自分类Dev

如何使用扫描仪的定界符方法

来自分类Dev

Scanner Java混淆中的定界符

来自分类Dev

在c＃中查找csv或文本文件的定界符

来自分类Dev

在定界符处分割文件，每个定界符后都有内容的文件扩展名

来自分类Dev

使用标准定界符将字符串修改为定义的输出模式，并用于分配值标签

来自分类Dev

从Java中的二进制文件读取时，如何检查空字节定界符？

来自分类Dev

在Java中读取具有多个定界符的文件行

来自分类Dev

使用定界符数组

来自分类Dev

使用定界符angularJS

来自分类Dev

使用多个定界符networkx / pandas从.txt文件中添加具有属性的节点

来自分类Dev

使用定界符在Powershell中拆分文件名

来自分类Dev

unix命令，使用定界符删除文本文件中的空格

来自分类Dev

BASH：仅在文件中的定界符之间搜索，而无需使用“剪切”

来自分类Dev

使用awk删除管道定界符文件中的前导零

来自分类Dev

使用定界符分割字符串，然后使用XSL将每个值存储在变量中

来自分类Dev

批处理文件中的定界符问题

来自分类Dev

字段定界符中的通配符-读取.csv文件

来自分类Dev

如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

来自分类Dev

如何使用Jsoup将不允许的html标签定界符转换为存在不允许的标签的实体

来自分类Dev

VB脚本使用定界符从文件中提取文本

来自分类Dev

使用Sed删除定界符之间的内容，但保留第一个定界符

Related 相关文章

文章