Groovy:解析内部带有HTML标记的xml

亚历克斯·德巴(Alex Deba)

我的问题是关于解析XML,其中字符串值中包含HTML标记:

def xmlString = '''
<resource>
   <string name="my_test">No problem here!</string>
   <string name="my_text">
<b> <big>My bold and big title</big></b>
   Rest of the text
  </string>
</resource>
'''

(这是一个Android资源文件)

当我使用XmlSlurper时,HTML标记被删除。这段代码:

def resources = new XmlSlurper().parseText(xmlString )
resources.string.each { string ->
    println "string name = " + string.@name + ", string value = " + string.text()
}

将产生

string name = my_test, string value = No problem here!
string name = my_text, string value = My bold and big title
   Rest of the text

我可以使用CDATA来防止HTML标记被解析,但是当使用字符串my_text时,将不会处理这些HTML标记。

我还尝试使用StreamingMarkupBuilder,如该SO答案所述:如何使用groovy从XML文件中提取HTML代码,但随后仅显示HTML标签和它们之间的文本:

<b><big>My bold and big title</big></b>

并且不显示第一个字符串。提前致谢!

用户898650
def xmlString = '''
<resource>
    <string name="my_test">No problem here!</string>
    <string name="my_text">
        <b><big>My bold and big title</big></b>
        Rest of the text
    </string>
</resource>
'''

def result = []
def resources = new XmlSlurper().parseText(xmlString).string

resources.each { resource ->
    result << new groovy.xml.StreamingMarkupBuilder().bind { mkp.yield resource.getBody() }
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Groovy:解析内部带有HTML标记的xml

来自分类Dev

使用NSXMLParser解析节点内部带有html的xml

来自分类Dev

带有重复标记的xml解析

来自分类Dev

将带有HTML标记的XML解析为CSV时丢失空格

来自分类Dev

解析带有标记中带有字符“&”的标记的XML文件

来自分类Dev

在python中解析带有重点标记的xml文件

来自分类Dev

使用PHP解析带有递增标记值的XML

来自分类Dev

如何只提取内部带有<strong>的<p>的HTML标记?

来自分类Dev

如何仅提取内部带有<strong>的<p>的HTML标记?

来自分类Dev

在带有slurper或解析器的groovy解析后如何遍历嵌套XML

来自分类Dev

CSS / HTML:带有内部跨度,跨度边距的标记,在悬停划线下创建空白

来自分类Dev

您如何在Eclipse中解析带有HTML标记的注释?

来自分类Dev

如何使用Android上的DocumentBuilder DOM解析器解析带有包含非拉丁Unicode字符的标记名的XML

来自分类Dev

解析xml时如何保留html标记?

来自分类Dev

XML <example>标记,带有:(<m:example>)

来自分类Dev

带有 MarkupBuilder 的 Groovy SOAP 请求 XML

来自分类Dev

发送带有html:link标记的bean

来自分类Dev

发送带有html:link标记的bean

来自分类Dev

返回带有substr的html标记jQuery?

来自分类Dev

带有HTML标签的Javascript内部HTML

来自分类Dev

在PHP中从XML内部解析HTML标签

来自分类Dev

解析到div的内部HTML时,form标记消失

来自分类Dev

HTML中的<li>标记是否带有结束标记?

来自分类Dev

Java解析带有文件删除的XML

来自分类Dev

如何选择带有内部html的类?

来自分类Dev

Groovy解析xml

来自分类Dev

在Groovy中解析XML

来自分类Dev

如何快速解析带有HTML的Json

来自分类Dev

获取包含HTML标记的文本XML解析Android

Related 相关文章

热门标签

归档