我正在使用redmine插件(这限制了我更改某些方法的能力),并且我有类似以下内容的单词数组
["h1.", "Wiki", "\r\n", "qweqwe", "\r\n", "additional", "\r\n", "<br>", "\r\n", "<br>", "\r\n", "{{toc}}", "\r\n", "<br>", "\r\n", "<br>", "\r\n", "Hello", "World<br>", "\r\n", "<br>", "\r\n", "<br>"]
我想做的是剥离所有html标记,包括此数组中的换行符,仅保留单词。有什么方法可以做到吗?
AFAIK,没有内置的方法可以做到这一点,但是很容易实现:
s = [...]
s.map { |e|
r = e.gsub(/\r|\n|<.*?>/, '').strip
r.empty? ? nil : r
}.compact
#⇒ => [
# [0] "h1.",
# [1] "Wiki",
# [2] "qweqwe",
# [3] "additional",
# [4] "{{toc}}",
# [5] "Hello",
# [6] "World"
#]
或者,使用reject
:
s.map { |e|
e.gsub(/\r|\n|<.*?>/, '').strip
}.reject(&:empty?)
当然,您可以随意改进regexp的模式以删除要删除的任何内容。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句