次の正規表現パターンが一致するまで文字列全体を取得するにはどうすればよいですか?

うさまハイダー

私は次のコードを持っています:

pat = re.compile(r'^(\d+\/\d+\/\d+,\s\d+:\d+\s\w+\s-\s)', re.S | re.M)
with open(r'C:\Users\usamahaider\Downloads\mmm.txt', encoding="utf8") as f:
    mylist = [m.group(1) for m in pat.finditer(f.read())]
print(mylist)

出力は次のとおりです。

['12/30/19, 8:57 AM - ', '12/3/19, 14:57 AM - ', '9/20/19, 8:52 AM - ', '12/3/19, 8:57 AM - ', '12/3/19, 9:34 PM - ', '12/3/19, 9:34 PM - ', '12/4/19, 6:45 AM - ', '12/4/19, 6:49 AM - ', '12/4/19, 7:12 AM - ', '12/4/19, 7:19 AM - ', '12/4/19, 7:20 AM - ', '12/4/19, 7:34 AM - ', '12/4/19, 8:00 AM - ', '12/4/19, 9:45 AM - ', '12/4/19, 10:15 AM - ', '12/4/19, 10:55 AM - ']

これはパターンを返すだけですが、すべてのテキストを単一のパターンに関連付けたいと思います。

このようなもの:

['12/30/19, 8:57 AM -Messages and calls are end-to-end encrypted. No one outside of this chat, not even WhatsApp, can read or listen to them. Tap to learn more. ', '12/3/19, 14:57 AM - You joined using this group's invite link', '9/20/19, 8:52 AM - (347) 599-6911 created group "Sunnah Marriage Group 1"']

テキストファイルは次のようになります。

12/30/19, 8:57 AM - Messages and calls are end-to-end encrypted. No one 

outside of this chat, not even WhatsApp, can read or listen to them. Tap to learn more.
12/3/19, 14:57 AM - You joined using this group's invite link
9/20/19, 8:52 AM - (347) 599-6911 created group "Sunnah Marriage Group 1"
12/3/19, 8:57 AM - You joined using this group's invite link

12/3/19, 9:34 PM - +1 (516) 343-8410: Gender: Female
Height: 5’ 8”
Age: 21
Education: 1st Yr Medical School
Profession: Future Doctor
Marital status: Never married
Ethnicity: Pakistani
Religious background: Sunni
Family: Parents, Brothers, Sister
Language: English, Urdu
Hobbies: Travel, Art, Reading

LOOKING FOR: 
Age : 24-29
Height: 5’ 10” or taller
Religion: Sunni Muslim 
Education: MD/DO
Profession: Doctor/ Medical Residency/Medical Student 
Marital Status: Never married 

Contact: Mother
WhatsApp: (647) 879-1400
12/3/19, 9:34 PM - +1 (516) 343-8410: <Media omitted>
12/4/19, 6:45 AM - (347) 599-6911 changed this group's settings to allow all participants to send messages to this group
12/4/19, 6:49 AM - (347) 599-6911: As Salamualikum warahmatullah. Please Post and forward practicing muslims and your profiles in order to remain in the group. You have 1 day to post it until settings changes again. Strictly No chatting and no picture in the group. Please contact interested candidates in private. JazakAllahu Khairn. May Allah make halal easy for all the believers....Ameen
Ryszardチェコ語

使用する

re.split(r'^(?=\d+/\d+/\d+,\s\d+:\d+\s+\w+\s+-\s)', string, flags=re.M)

証明を参照してください

Pythonの 証明

import re
string = """12/30/19, 8:57 AM - Messages and calls are end-to-end encrypted. No one \n\noutside of this chat, not even WhatsApp, can read or listen to them. Tap to learn more.\n12/3/19, 14:57 AM - You joined using this group's invite link\n9/20/19, 8:52 AM - (347) 599-6911 created group "Sunnah Marriage Group 1"\n12/3/19, 8:57 AM - You joined using this group's invite link\n\n12/3/19, 9:34 PM - +1 (516) 343-8410: Gender: Female\nHeight: 5’ 8”\nAge: 21\nEducation: 1st Yr Medical School\nProfession: Future Doctor\nMarital status: Never married\nEthnicity: Pakistani\nReligious background: Sunni\nFamily: Parents, Brothers, Sister\nLanguage: English, Urdu\nHobbies: Travel, Art, Reading\n\nLOOKING FOR: \nAge : 24-29\nHeight: 5’ 10” or taller\nReligion: Sunni Muslim \nEducation: MD/DO\nProfession: Doctor/ Medical Residency/Medical Student \nMarital Status: Never married \n\nContact: Mother\nWhatsApp: (647) 879-1400\n12/3/19, 9:34 PM - +1 (516) 343-8410: <Media omitted>\n12/4/19, 6:45 AM - (347) 599-6911 changed this group's settings to allow all participants to send messages to this group\n12/4/19, 6:49 AM - (347) 599-6911: As Salamualikum warahmatullah. Please Post and forward practicing muslims and your profiles in order to remain in the group. You have 1 day to post it until settings changes again. Strictly No chatting and no picture in the group. Please contact interested candidates in private. JazakAllahu Khairn. May Allah make halal easy for all the believers....Ameen"""
results = list(filter(None, re.split(r'^(?=\d+/\d+/\d+,\s\d+:\d+\s+\w+\s+-\s)', string, flags=re.M)))
for line in results: print('====',line.strip())

結果

==== 12/30/19, 8:57 AM - Messages and calls are end-to-end encrypted. No one 

outside of this chat, not even WhatsApp, can read or listen to them. Tap to learn more.
==== 12/3/19, 14:57 AM - You joined using this group's invite link
==== 9/20/19, 8:52 AM - (347) 599-6911 created group "Sunnah Marriage Group 1"
==== 12/3/19, 8:57 AM - You joined using this group's invite link
==== 12/3/19, 9:34 PM - +1 (516) 343-8410: Gender: Female
Height: 5’ 8”
Age: 21
Education: 1st Yr Medical School
Profession: Future Doctor
Marital status: Never married
Ethnicity: Pakistani
Religious background: Sunni
Family: Parents, Brothers, Sister
Language: English, Urdu
Hobbies: Travel, Art, Reading

LOOKING FOR: 
Age : 24-29
Height: 5’ 10” or taller
Religion: Sunni Muslim 
Education: MD/DO
Profession: Doctor/ Medical Residency/Medical Student 
Marital Status: Never married 

Contact: Mother
WhatsApp: (647) 879-1400
==== 12/3/19, 9:34 PM - +1 (516) 343-8410: <Media omitted>
==== 12/4/19, 6:45 AM - (347) 599-6911 changed this group's settings to allow all participants to send messages to this group
==== 12/4/19, 6:49 AM - (347) 599-6911: As Salamualikum warahmatullah. Please Post and forward practicing muslims and your profiles in order to remain in the group. You have 1 day to post it until settings changes again. Strictly No chatting and no picture in the group. Please contact interested candidates in private. JazakAllahu Khairn. May Allah make halal easy for all the believers....Ameen

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

一致する文字列を取得するための正規表現パターンを作成するにはどうすればよいですか?

分類Dev

特定の文字列が正規表現パターンに一致するかどうかを確認するにはどうすればよいですか?

分類Dev

正規表現パターンに一致しない文字列の出現を完全に破棄するにはどうすればよいですか?

分類Dev

文字列全体がJavascriptの正規表現と一致するかどうかを確認するにはどうすればよいですか?

分類Dev

正規表現がJavaScriptの文字列全体と一致するかどうかを確認するにはどうすればよいですか?

分類Dev

パターンの一部ではない単一の文字に正規表現を一致させるにはどうすればよいですか?

分類Dev

正規表現グループ:より具体的な一致パターンで目的の出力を取得するにはどうすればよいですか?

分類Dev

正規表現に一致する文字列のファイルパスを取得するにはどうすればよいですか?

分類Dev

トークンが正規表現パターンと一致するかどうかを確認するにはどうすればよいですか?

分類Dev

文字列全体を1つの正規表現で2つの形式のいずれかに一致させるにはどうすればよいですか?

分類Dev

Pythonで各正規表現が一致するグループの前後に文字列を追加するにはどうすればよいですか?

分類Dev

次の非スペース文字が「/」ではない正規表現を一致させるにはどうすればよいですか?

分類Dev

正規表現JAVAでパターンマッチャーを使用するときに残りの一致しない文字列を取得するにはどうすればよいですか?

分類Dev

1つのパラメーターを使用して複数の正規表現の一致を取得するにはどうすればよいですか?

分類Dev

正規表現-パターンに一致する文字と一致しない文字のすべてのグループを一致させるにはどうすればよいですか?

分類Dev

RGBの文字列リストが正規表現パターンと一致するかどうかを確認するにはどうすればよいですか?

分類Dev

Bashで文字列を正規表現と一致させるにはどうすればよいですか?

分類Dev

Javaで複数の正規表現一致を取得するにはどうすればよいですか?

分類Dev

正規表現に一致する特定の文字列を取得するにはどうすればよいですか?

分類Dev

NSRegularExpressionを使用せずに、文字列正規表現のすべての一致を取得するにはどうすればよいですか?

分類Dev

文字列の先頭から正規表現で1つの一致を取得するにはどうすればよいですか?

分類Dev

正規表現が文字列全体(部分文字列なし)に一致する場合にのみ、JSregexpを使用して文字列に一致させるにはどうすればよいですか?

分類Dev

最小文字列と正規表現を一致させるにはどうすればよいですか?

分類Dev

Powershell +正規表現-複数の一致を取得するにはどうすればよいですか?

分類Dev

PostgreSQLで文字列内の正規表現の一致の位置を取得するにはどうすればよいですか?

分類Dev

パターンに一致する特定の既知の単語を除外しながら、パターンに一致する正規表現を作成するにはどうすればよいですか?

分類Dev

入力文字列全体(スペースで区切られた実数)がPythonの正規表現と一致するかどうかを確認するにはどうすればよいですか?

分類Dev

この正規表現の一致で引用符で囲まれた文字列を無視するにはどうすればよいですか?

分類Dev

ColdFusionまたはJavaの正規表現でラテンユニコード文字を一致させるにはどうすればよいですか?

Related 関連記事

  1. 1

    一致する文字列を取得するための正規表現パターンを作成するにはどうすればよいですか?

  2. 2

    特定の文字列が正規表現パターンに一致するかどうかを確認するにはどうすればよいですか?

  3. 3

    正規表現パターンに一致しない文字列の出現を完全に破棄するにはどうすればよいですか?

  4. 4

    文字列全体がJavascriptの正規表現と一致するかどうかを確認するにはどうすればよいですか?

  5. 5

    正規表現がJavaScriptの文字列全体と一致するかどうかを確認するにはどうすればよいですか?

  6. 6

    パターンの一部ではない単一の文字に正規表現を一致させるにはどうすればよいですか?

  7. 7

    正規表現グループ:より具体的な一致パターンで目的の出力を取得するにはどうすればよいですか?

  8. 8

    正規表現に一致する文字列のファイルパスを取得するにはどうすればよいですか?

  9. 9

    トークンが正規表現パターンと一致するかどうかを確認するにはどうすればよいですか?

  10. 10

    文字列全体を1つの正規表現で2つの形式のいずれかに一致させるにはどうすればよいですか?

  11. 11

    Pythonで各正規表現が一致するグループの前後に文字列を追加するにはどうすればよいですか?

  12. 12

    次の非スペース文字が「/」ではない正規表現を一致させるにはどうすればよいですか?

  13. 13

    正規表現JAVAでパターンマッチャーを使用するときに残りの一致しない文字列を取得するにはどうすればよいですか?

  14. 14

    1つのパラメーターを使用して複数の正規表現の一致を取得するにはどうすればよいですか?

  15. 15

    正規表現-パターンに一致する文字と一致しない文字のすべてのグループを一致させるにはどうすればよいですか?

  16. 16

    RGBの文字列リストが正規表現パターンと一致するかどうかを確認するにはどうすればよいですか?

  17. 17

    Bashで文字列を正規表現と一致させるにはどうすればよいですか?

  18. 18

    Javaで複数の正規表現一致を取得するにはどうすればよいですか?

  19. 19

    正規表現に一致する特定の文字列を取得するにはどうすればよいですか?

  20. 20

    NSRegularExpressionを使用せずに、文字列正規表現のすべての一致を取得するにはどうすればよいですか?

  21. 21

    文字列の先頭から正規表現で1つの一致を取得するにはどうすればよいですか?

  22. 22

    正規表現が文字列全体(部分文字列なし)に一致する場合にのみ、JSregexpを使用して文字列に一致させるにはどうすればよいですか?

  23. 23

    最小文字列と正規表現を一致させるにはどうすればよいですか?

  24. 24

    Powershell +正規表現-複数の一致を取得するにはどうすればよいですか?

  25. 25

    PostgreSQLで文字列内の正規表現の一致の位置を取得するにはどうすればよいですか?

  26. 26

    パターンに一致する特定の既知の単語を除外しながら、パターンに一致する正規表現を作成するにはどうすればよいですか?

  27. 27

    入力文字列全体(スペースで区切られた実数)がPythonの正規表現と一致するかどうかを確認するにはどうすればよいですか?

  28. 28

    この正規表現の一致で引用符で囲まれた文字列を無視するにはどうすればよいですか?

  29. 29

    ColdFusionまたはJavaの正規表現でラテンユニコード文字を一致させるにはどうすればよいですか?

ホットタグ

アーカイブ