Python-带有日文字母的正则表达式仅匹配一个字符

debugcn 发表于 Dev

滕西格

我正在尝试在日语地址中找到某些单词，以便可以对其进行擦洗。如果只有一个字符，则正则表达式可以正常工作，但是它们似乎找不到2个或更多字符的字符串：

import re
add = u"埼玉県川口市金山町１２丁目１－１０４番地"

test = re.search(ur'["番地"|"丁目"]',add)
print test.group(0)

丁

我可以使用re.findall代替re.search，但是它将所有发现放入一个元组中，因此我必须解析该元组。如果那是最好的方式，我可以忍受，但我认为我缺少了一些东西。

在上面的示例中，我想用破折号交换“丁目”并删除尾随的“番地”，这样地址就读成：

Sa玉县川口市金山町12-1-104

虚假的

您正在|字符类（[....]）内部使用。它将匹配那里列出的所有字符；这不是你想要的。

指定不带字符类的模式。（也没有"）

>>> import re
>>> add = u"埼玉県川口市金山町１２丁目１－１０４番地"
>>> test = re.search(ur'番地|丁目', add)
>>> test.group(0)
u'\u4e01\u76ee'
>>> print test.group(0)
丁目

要获得所需的内容，请使用str.replace（unicode.repalce）和re.sub。

>>> print re.sub(u'番地$', u'', add.replace(u'丁目', u'－'))
埼玉県川口市金山町１２－１－１０４

$仅用于匹配字符串的末尾。如果的位置番地$无关紧要，则不需要正则表达式。str.replace足够：

>>> print re.sub(u'番地$', u'', add.replace(u'丁目', u'－'))
埼玉県川口市金山町１２－１－１０４

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-8

我来说两句

0条评论

登录后参与评论

来自分类Dev

Python正则表达式-匹配某些第一个字符，但不匹配W

来自分类Dev

Python 3-正则表达式-匹配少一个字符的字符串

来自分类Dev

第一个字符出现后的 Python 正则表达式匹配组

来自分类Dev

如何从 Python 中的正则表达式中只提取一个字符串？

来自分类Dev

Python正则表达式匹配包含字母和数字的8个字符的字符串

来自分类Dev

检查一个字符串是否包含另一个字符串的全部或3个连续字符？正则表达式python不区分大小写

来自分类Dev

Python正则表达式仅匹配整个字符串

来自分类Dev

带有可选组的Python正则表达式，至少匹配一个

来自分类Dev

Python正则表达式：仅获取一个匹配的表达式

来自分类Dev

如果字符串是特殊字符，如何在python中使用正则表达式删除它的第一个和最后一个字符

来自分类Dev

Python（正则表达式：单个字母后替换每个字符）

来自分类Dev

正则表达式负前瞻仅匹配一个字符

来自分类Dev

Python-正则表达式仅保留带有文字字符的单词

来自分类Dev

python正则表达式仅匹配第一个实例

来自分类Dev

正则表达式，前两个字符作为字母 Python

来自分类Dev

Python正则表达式以两个不同的顺序匹配两个字符串？

来自分类Dev

python正则表达式匹配2个字符之间不包含某些单词的任何东西

来自分类Dev

Python正则表达式返回最后一个匹配字符的额外捕获组

来自分类Dev

两个字符串之间的python正则表达式匹配

来自分类Dev

Python正则表达式：替换匹配项中的单个字符

来自分类Dev

正则表达式匹配字符串，长度为3-6个字符，至少一个字母，没有重复的“-”

来自分类Dev

正则表达式验证仅具有小写字母的字符串，第一个字符必须为字母

来自分类Dev

正则表达式以验证仅具有小写字母的字符串，第一个字符必须为字母

来自分类Dev

Python 正则表达式排除 / 后带有字母的匹配项

来自分类Dev

正则表达式仅匹配第一个字符

来自分类Dev

如果文本仅包含一个字符串，则匹配文本的正则表达式

来自分类Dev

仅一个字符的正则表达式

来自分类Dev

排除正则表达式匹配的最后一个字符

来自分类Dev

匹配正则表达式中的第一个字符？

Related 相关文章

文章