在Python中使用Regex时,使用方括号表示一系列字符很容易a-z
,但这似乎不适用于其他语言,例如阿拉伯语:
import re
pattern = '[ي-ا]'
p = re.compile(pattern)
这会导致出现一个长错误报告,结尾为
raise error("bad character range")
sre_constants.error: bad character range
如何解决?
请改用Unicode转义。
>>> re.compile('[\u0627-\u064a]')
<_sre.SRE_Pattern object at 0x237f460>
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句