我在需要删除的字符串中有Unicode换行符。
这些字符可以是回车符\U000D,换行符\U000A,行分隔符或段落分隔符。
\U000D
\U000A
我可以使用以下命令删除回车符和换行符。
gsub("\\s", "", x)
就像我说的那样,这对于那些Unicode字符来说很好用,但是我无法删除行分隔符\U2028或段落分隔\U2029符。
\U2028
\U2029
还有另一种方法吗?
您可以打开PCRE使用perl=T,并利用方便的转义序列(\R)
PCRE
perl=T
\R
> x <- 'foo\U000D\U000A bar\U2029 baz\U2028\U2029' > x ## [1] "foo\r\n bar\u2029 baz\u2028\u2029" > gsub('\\R', '', x, perl=T) ## [1] "foo bar baz"
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
点击生成二维码
我来说两句