我正在使用Ruta脚本来识别货币,但是遇到美元符号($)等特殊字符的麻烦。
我尝试用简单的字符:
W{REGEXP("(dollar|nzd|$)") -> MARK(EntityType)};
逃避它:
包pool.ruta.example;
W{REGEXP("(dollar|nzd|\$)") -> MARK(EntityType)};
在第一种情况下,无法识别我的模式,在第二种情况下,编辑器给我一个错误。
识别特殊字符的正确方法是什么?
干杯。
在UIMA Ruta中,特殊字符是默认种子注释的一部分SPECIAL
。您的规则仅在单词标记上匹配W
;因此不会开火。
如果只想将$作为特殊字符进行匹配,则可以按照以下方式SPECIAL
使用REGEXP
条件限制注释W
:
// I spent $100.
SPECIAL{REGEXP("\\$"} -> Currency} NUM{-> Amount};
让我知道是否有帮助。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句