我正在尝试删除 r 中的非阿拉伯语单词,我尝试了这段代码,但它删除了所有内容
> L<-"you المجدo to yes"
> gsub("[^\\p{InArabic}.,]+","",L)
[1] ""
您需要添加perl = TRUE
以便 R 在 PCRE 模式下编译正则表达式。
此外,我不确定这{InArabic}
是一个受支持的字符类 - 尽管{Arabic}
似乎确实如此,至少在我的 R 版本中(R 版本 3.4.4 (2018-03-15) -- "Someone to Lean On"):
> L<-"you المجدo to yes"
>
> gsub("[^\\p{Arabic}.,]+", "", L, perl = TRUE)
[1] "المجد"
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句