我在这里与Cloudera一起练习MapReduce 。但是,目前,该教程仅使用Java中的此正则表达式按空格分割单词:
private static final Pattern WORD_BOUNDARY = Pattern.compile("\\s*\\b\\s*");
但是,除了空格之外"\\s*"
,我还想通过逗号,句点(。)和制表符(\ t),括号(),方括号[]和花括号({})字符来定义单独的单词。换句话说,我将单词定义为具有一个或多个字母数字字符并由两个非字母数字字符界定的字符串。例如:
()
{]
<space>
和绑定)
那么,如何编写我的正则表达式才能获得此要求?
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句