我想知道如何才能从字符串中完全消除所有特殊字符。换句话说,我只留下单词,这样就消除了+-òç@èé等其他任何字符。
现在我用
myString = Normalizer.normalize(myString, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", "");
但是一些字符专家仍然存在。
用\p{ASCII}
只包含您允许的字符的更严格的设置替换正则表达式类。例如,
myString = Normalizer.normalize(myString, Normalizer.Form.NFD).replaceAll("[^a-zA-Z]", "");
将首先将重音字符分解é
为两部分e
+ combining ´
(正常形式D),然后正则表达式将删除不是ASCII a..z或A..Z的任何字符。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句