R删除Unicode换行符

用户名

我在需要删除的字符串中有Unicode换行符。

这些字符可以是回车符\U000D,换行符\U000A,行分隔符或段落分隔符。

我可以使用以下命令删除回车符和换行符。

gsub("\\s", "", x)

就像我说的那样,这对于那些Unicode字符来说很好用,但是我无法删除行分隔符\U2028或段落分隔\U2029符。

还有另一种方法吗?

wn

您可以打开PCRE使用perl=T,并利用方便的转义序列(\R

> x <- 'foo\U000D\U000A bar\U2029 baz\U2028\U2029'
> x
## [1] "foo\r\n bar\u2029 baz\u2028\u2029"
> gsub('\\R', '', x, perl=T)
## [1] "foo bar baz"

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章