名前の標準化のためのPython正規表現

sisanared

名前を標準化するための正規表現を書こうとしています。

使用事例:

J. J. Abrams -> JJ Abrams
J J Abrams -> JJ Abrams
J.J Abrams -> JJ Abrams
J.J. Abrams -> JJ Abrams
J J  Abrams -> JJ Abrams (multiple spaces)

イニシャルは、名前の最後または途中に表示できます。一般に、イニシャルにはスペースまたは「。」を含めることができます。またはその前後の単語の境界。

だから私はこれを思いついた:

p = re.compile(r'((\b|\s+|\.)[a-z](\.|\s+|\b))', re.I)

結果を一致させて印刷しようとすると、間違って見えます。

p.subn(lambda g: g.groups()[0].strip().strip('.'), "J J Abrams")
('JJAbrams', 2)

非初期部分の前(または後)にスペースを保持するにはどうすればよいですか?

編集また、私はそれを明確にすべきでした、名前には2つ以上のイニシャルが含まれる可能性があります。上記は、ランダムなユースケースの1つにすぎません。ありがとう

サムワン

与えられた場合、交換

(?<=\b[A-Z]\b)[. ]+(?=[A-Z]\b)|\.|(\s)\s+

$1

それをする必要があります。

イニシャル間のスペースとドット、任意の場所のドット、または複数のスペースを交互に使用して一致します。後者は最初のスペースをキャプチャします。

これをに置き換えると$1、最初の2つの交代から一致削除され、3番目のケース(いくつかのスペース)では、それらが1つ(最初にキャプチャされたもの)に置き換えられます。

こちらのregex101でご覧ください

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

名前を匿名化するための正規表現

分類Dev

特定の名前の検証のためのJavascript正規表現

分類Dev

名前検証のための一意の正規表現

分類Dev

別の名前を選択するための正規表現

分類Dev

名前の正規表現

分類Dev

名前の正規表現

分類Dev

正規表現の質問:医学用語の標準化

分類Dev

この特定の形式の名前を検証するための正規表現

分類Dev

正規表現の名前と名前

分類Dev

名前のイニシャルのための正規表現チェック

分類Dev

DCのTCL:非標準の階層名の正規表現マッチング

分類Dev

名前のないCookieをチェックするための正規表現

分類Dev

名前の接尾辞を見つけるための正規表現

分類Dev

家系の名前の正規表現

分類Dev

家系の名前の正規表現

分類Dev

単一行の標準USPSアドレスを照合するための正規表現

分類Dev

名前をクリーンアップするための正規表現

分類Dev

Pythonの標準正規分布

分類Dev

javascriptで検証するためのパスワード正規表現標準を作成する方法

分類Dev

名前のJavascript検証正規表現

分類Dev

名前タイプの正規表現

分類Dev

正規表現の名前エラー

分類Dev

検索:名前の正規表現

分類Dev

月の名前の前にある番号を見つけるための正規表現(パンダ)

分類Dev

番号Rの前に削除するための正規表現

分類Dev

正規表現を使用したPythonの名前変更ファイル

分類Dev

正規表現の前にPython正規表現が分割されました

分類Dev

正規表現を使用した名前の検証

分類Dev

Python、文字列でファイル名を取得するための正規表現

Related 関連記事

  1. 1

    名前を匿名化するための正規表現

  2. 2

    特定の名前の検証のためのJavascript正規表現

  3. 3

    名前検証のための一意の正規表現

  4. 4

    別の名前を選択するための正規表現

  5. 5

    名前の正規表現

  6. 6

    名前の正規表現

  7. 7

    正規表現の質問:医学用語の標準化

  8. 8

    この特定の形式の名前を検証するための正規表現

  9. 9

    正規表現の名前と名前

  10. 10

    名前のイニシャルのための正規表現チェック

  11. 11

    DCのTCL:非標準の階層名の正規表現マッチング

  12. 12

    名前のないCookieをチェックするための正規表現

  13. 13

    名前の接尾辞を見つけるための正規表現

  14. 14

    家系の名前の正規表現

  15. 15

    家系の名前の正規表現

  16. 16

    単一行の標準USPSアドレスを照合するための正規表現

  17. 17

    名前をクリーンアップするための正規表現

  18. 18

    Pythonの標準正規分布

  19. 19

    javascriptで検証するためのパスワード正規表現標準を作成する方法

  20. 20

    名前のJavascript検証正規表現

  21. 21

    名前タイプの正規表現

  22. 22

    正規表現の名前エラー

  23. 23

    検索:名前の正規表現

  24. 24

    月の名前の前にある番号を見つけるための正規表現(パンダ)

  25. 25

    番号Rの前に削除するための正規表現

  26. 26

    正規表現を使用したPythonの名前変更ファイル

  27. 27

    正規表現の前にPython正規表現が分割されました

  28. 28

    正規表現を使用した名前の検証

  29. 29

    Python、文字列でファイル名を取得するための正規表現

ホットタグ

アーカイブ