我的正则表达式:
vendor = "MyNameIsJoe. I'mWorkerInAAAinc."
ven = re.split(r'(?<=[a-z])[A-Z]|[A-Z](?=[a-z])', vendor)
以大写字母分割字符串,例如:
'我的名字是乔。I'mWorkerInAAAinc'变成'我的名字叫乔。我是AAA公司的工人。
您可以使用re.findall()
来查找期望的单词而不是拆分:
In [46]: ' '.join(re.findall(r'[A-Z]?[^A-Z\s]+|[A-Z]+', vendor))
Out[46]: "My Name Is Joe. I'm Worker In AAA inc."
请注意,此选择[A-Z]+
将与匹配,AAA
这意味着如果您不希望使用长度小于1的大写字母的任何组合,则可以简单地使用AAA
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句