使用JSoup在Java中修改html标记自身的文本

SHA3​​3

是的,假设我有这段HT​​ML

<p>And finally, how about some <a href="http://www.yahoo.com/">Links?</a></p>

我只想访问和修改“最后,关于某些内容”部分,并获得以下信息:

<p>new text <a href="http://www.yahoo.com/">Links?</a></p>

我似乎不知道如何。到目前为止,这是我尝试过的方法:

Document doc = null;
    try {
        doc = Jsoup.connect("http://csb.stanford.edu/class/public/pages/sykes_webdesign/05_simple.html").userAgent("Mozilla").get();
    } catch (IOException e1) {
        e1.printStackTrace();
    }
Elements d = doc.body().children();
Element e = d.get(20); //Assuming the HTML line in question is found at index 20
e.text("new text") //just outputs <p>new value</p>, which is not good for me

看来我可以通过

Element e = d.get(20);
System.out.println("\n"+e.ownText()); //outputs: And finally, how about some

但是修改它不起作用。

Element e = d.get(20);
String s = e.toString().replace(e.ownText(), "new text");
e.text(s);
System.out.println(e.toString());

上面代码的输出是

<p>&lt;p&gt;changed &lt;a href=&quot;http://www.yahoo.com/&quot;&gt;Links?&lt;/a&gt;&lt;/p&gt;</p>

似乎将标记用作文字,但是我希望将它们用作<或>,因为然后必须使用新文本重新构建网页。

任何帮助将不胜感激。

普什莫

怎么样

Element e = d.get(20);
e.text("new text"); 
e.append("<a href=\"http://www.yahoo.com/\">Links?</a>");//lets you add HTML.

如果链接是动态的,并且您不想更改它,则可以先存储它,然后再使用

Element e = d.get(20);
Element link = e.child(0);
e.text("new text"); 
e.append(link.toString());

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用jsoup编辑html标记中的所有文本值

来自分类Dev

使用Jsoup一一从HTML标记中提取文本

来自分类Dev

JSOUP使用Nodes获取HTML标记之外的特定文本

来自分类Dev

如何使用jsoup提取html标记之外的文本?

来自分类Dev

如何在JSoup Java中仅显示html标记?

来自分类Dev

Jsoup选择包含HTML标记的文本

来自分类Dev

Jsoup选择包含HTML标记的文本

来自分类Dev

使用Jsoup查找未标记的文本

来自分类Dev

使用Jsoup Java从文本检索HTML结构

来自分类Dev

使用Jsoup Java从文本检索HTML结构

来自分类Dev

如何使用Java和Jsoup解析HTML文本和链接

来自分类Dev

如何使用Jsoup从文本中仅删除html标签?

来自分类Dev

使用jsoup的HTML DOM的标记深度和最大标记深度

来自分类Dev

使HTML中的文本变大而不使用N大标记

来自分类Dev

使html中的文本变大而不使用N大标记

来自分类Dev

如何使用Jsoup解析HTML文档中“标记名”的元素列表?

来自分类Dev

使用Java修改HTML

来自分类Dev

Java JSoup:修改URL

来自分类Dev

Java JSoup:修改URL

来自分类Dev

Java中的自身事件无法修改Classobjects?

来自分类Dev

使用Jsoup解析blockquotes中的文本

来自分类Dev

无法使用jsoup从网站html解析中获取文本和链接

来自分类Dev

使用jQuery提取HTML标记外的文本

来自分类Dev

使用BeautifulSoup在HTML标记后获取文本

来自分类Dev

Jsoup:从锚标记中提取内部文本

来自分类Dev

仅删除jsoup中标记之间的文本

来自分类Dev

使用JSoup for Java时HTML的格式问题

来自分类Dev

使用JSOUP打开HTML中的链接

来自分类Dev

如何使用 Jsoup 从 html 中检索数据