从数组中删除html标签

Avdept

我正在使用redmine插件(这限制了我更改某些方法的能力),并且我有类似以下内容的单词数组

["h1.", "Wiki", "\r\n", "qweqwe", "\r\n", "additional", "\r\n", "<br>", "\r\n", "<br>", "\r\n", "{{toc}}", "\r\n", "<br>", "\r\n", "<br>", "\r\n", "Hello", "World<br>", "\r\n", "<br>", "\r\n", "<br>"]

我想做的是剥离所有html标记,包括此数组中的换行符,仅保留单词。有什么方法可以做到吗?

阿列克谢·马蒂什金(Alexei Matiushkin)

AFAIK,没有内置的方法可以做到这一点,但是很容易实现:

s = [...]
s.map { |e| 
  r = e.gsub(/\r|\n|<.*?>/, '').strip
  r.empty? ? nil : r 
}.compact
#⇒ => [
#  [0] "h1.",
#  [1] "Wiki",
#  [2] "qweqwe",
#  [3] "additional",
#  [4] "{{toc}}",
#  [5] "Hello",
#  [6] "World"
#]

或者,使用reject

s.map { |e| 
  e.gsub(/\r|\n|<.*?>/, '').strip
}.reject(&:empty?)

当然,您可以随意改进regexp的模式以删除要删除的任何内容。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

删除HTML中的样式标签

来自分类Dev

删除脚本中的HTML标签

来自分类Dev

删除TinyMCE中的html,head,body标签

来自分类Dev

从txt文件中删除HTML标签

来自分类Dev

sed从html文件中删除标签

来自分类Dev

在RSS feed中删除HTML标签

来自分类Dev

如何从RSS feed中删除HTML标签?

来自分类Dev

从页面中删除特定的html标签

来自分类Dev

如何删除PHP中的HTML标签?

来自分类Dev

删除RSS feed中的HTML标签

来自分类Dev

从xpath @attribute中删除html标签

来自分类Dev

如何从RSS feed中删除HTML标签?

来自分类Dev

从字符串中删除html标签

来自分类Dev

删除html文件中匹配的标签?

来自分类Dev

删除 JSON 结果中的 HTML 标签

来自分类Dev

从 std::string 中删除 HTML 标签

来自分类Dev

删除 Freemarker 模板中的 HTML 标签

来自分类Dev

如何从标签外的html中删除文本?

来自分类Dev

启用删除html标签

来自分类Dev

从HTML标签删除评论

来自分类Dev

删除HTML标签

来自分类Dev

从HTML标签删除评论

来自分类Dev

从python中的网页集合中删除html标签的快速方法

来自分类Dev

cakephp:从引导程序中的标题标记中删除html标签

来自分类Dev

在vim中的html文件中删除标签之间的空格

来自分类Dev

从AngularJS中的字符串中删除HTML标签

来自分类Dev

从 Excel 中删除文本中 html 标签之间的“空格”

来自分类Dev

如何在本机反应中从responseJson中删除html标签?

来自分类Dev

如何使用Jsoup从文本中仅删除html标签?