파이썬에서 여러 정규식을 사용하여 특정 텍스트를 추출합니까?

베타 스

파이썬 3에서 정규식을 사용하는 데 문제가 있으므로 누군가가 나를 도울 수 있다면 기뻐할 것입니다. 다음과 같은 텍스트 파일이 있습니다.

Header A
text text
text text
Header B
text text
text text
Header C
text text
here is the end

내가하고 싶은 것은 헤더 사이에 텍스트 목록이 있지만 헤더 자체를 포함하는 것입니다. 이 정규식을 사용하고 있습니다.

 re.findall(r'(?=(Header.*?Header|Header.*?end))',data, re.DOTALL)

결과는 여기

['Header A\ntext text\n text text\n Header', 'Header B\ntext text\n text text\n Header', 'Header C\n text text here is the end']

문제는 목록의 모든 항목 끝에 다음 헤더가 있다는 것입니다. 보시다시피 모든 헤더는 다음 헤더를 찾으면 끝나지만 마지막 헤더는 특정 방식으로 끝나지 않습니다.

정규 표현식을 사용하여 자체 텍스트를 하위 문자열로 포함하는 모든 헤더의 목록 (튜플이 아님)을 얻는 방법이 있습니까?

vks
Header [^\n]*[\s\S]*?(?=Header|$)

데모를 참조하십시오.

https://regex101.com/r/iS6jF6/21

import re
p = re.compile(r'Header [^\n]*[\s\S]*?(?=Header|$)')
test_str = "Header A\ntext text\ntext text\nHeader B\ntext text\ntext text\nHeader C\ntext text\nhere is the end"

re.findall(p, test_str)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

파이썬에서 정규식을 사용하여 텍스트 파일에서 특정 문자열 추출

분류에서Dev

정규식을 사용하여 파이썬의 텍스트에서 특정 단어 추출

분류에서Dev

정규식을 사용하여 Snowflake에서 특정 텍스트 추출

분류에서Dev

파이썬에서 정규식을 사용하여 "----"로 구분 된 텍스트의 특수 부분을 어떻게 추출 할 수 있습니까?

분류에서Dev

정규식을 사용하여 원시 텍스트에서 특정 div를 구문 분석합니까?

분류에서Dev

정규식 Python을 사용하여 텍스트에서 파일 이름 추출

분류에서Dev

파이썬에서 정규식을 사용하여 텍스트 파일의 제목을 추출하는 방법은 무엇입니까?

분류에서Dev

특정 섹션을 구별하기 위해 정규식을 사용하여 텍스트에서 파이썬 사전을 만듭니다.

분류에서Dev

정규식을 사용하여 파이썬의 웹 페이지에서 정보를 추출하지만 "반환"을 만나면 실패합니까?

분류에서Dev

파이썬은이 패턴에 정규식을 사용하여 텍스트를 찾습니다.

분류에서Dev

정규 표현식을 사용하여 특정 텍스트를 찾습니다.

분류에서Dev

파이썬 : 정규식을 사용하여 일본어 트위터 텍스트에서 이모티콘 텍스트 추출

분류에서Dev

파이썬을 사용하여 웹 페이지에서 특정 텍스트 추출

분류에서Dev

정규 표현식을 사용하여 텍스트에서 태그로 구분 된 여러 인용을 추출하는 방법은 무엇입니까?

분류에서Dev

PHP를 사용하여 텍스트 파일에서 특정 정보 추출

분류에서Dev

파이썬에서 정규식을 사용하여 두 특정 문자 사이의 첫 번째 정수를 얻는 방법은 무엇입니까?

분류에서Dev

Python에서 정규식을 사용하여 특정 값 추출

분류에서Dev

정규식을 사용하여 일부 텍스트에서 두 필드를 추출 할 수 없습니다.

분류에서Dev

파이썬에서 정규식을 사용하여 문자열에서 여러 개의 연속 문자를 추출하십시오.

분류에서Dev

파이썬에서 정규식을 사용하여 알파벳을 제거하고 숫자를 추출하는 방법은 무엇입니까?

분류에서Dev

정규식을 사용하여 파일에서 특정 데이터 추출

분류에서Dev

정규식을 사용하여 텍스트에서 도움말 추출

분류에서Dev

정규식을 사용하여 두 마커 사이의 텍스트 추출

분류에서Dev

정규식을 사용하여 특정 조건에서 특정 기호를 캡처 / 그룹화합니까?

분류에서Dev

파이썬에서 숫자 범위를 사용하여 Excel 파일에서 특정 값 집합을 추출하는 방법은 무엇입니까?

분류에서Dev

C #을 사용하여 텍스트 파일에서 특정 텍스트 추출

분류에서Dev

정규식을 사용하여 두 줄 사이에 관련 텍스트를 추출하는 방법

분류에서Dev

vs-code : 정규식을 사용하여 열린 여러 파일에 텍스트를 추가 하시겠습니까?

분류에서Dev

파이썬을 사용하여 텍스트 파일에서 특정 데이터를 추출하고 CSV에 쓰는 방법

Related 관련 기사

  1. 1

    파이썬에서 정규식을 사용하여 텍스트 파일에서 특정 문자열 추출

  2. 2

    정규식을 사용하여 파이썬의 텍스트에서 특정 단어 추출

  3. 3

    정규식을 사용하여 Snowflake에서 특정 텍스트 추출

  4. 4

    파이썬에서 정규식을 사용하여 "----"로 구분 된 텍스트의 특수 부분을 어떻게 추출 할 수 있습니까?

  5. 5

    정규식을 사용하여 원시 텍스트에서 특정 div를 구문 분석합니까?

  6. 6

    정규식 Python을 사용하여 텍스트에서 파일 이름 추출

  7. 7

    파이썬에서 정규식을 사용하여 텍스트 파일의 제목을 추출하는 방법은 무엇입니까?

  8. 8

    특정 섹션을 구별하기 위해 정규식을 사용하여 텍스트에서 파이썬 사전을 만듭니다.

  9. 9

    정규식을 사용하여 파이썬의 웹 페이지에서 정보를 추출하지만 "반환"을 만나면 실패합니까?

  10. 10

    파이썬은이 패턴에 정규식을 사용하여 텍스트를 찾습니다.

  11. 11

    정규 표현식을 사용하여 특정 텍스트를 찾습니다.

  12. 12

    파이썬 : 정규식을 사용하여 일본어 트위터 텍스트에서 이모티콘 텍스트 추출

  13. 13

    파이썬을 사용하여 웹 페이지에서 특정 텍스트 추출

  14. 14

    정규 표현식을 사용하여 텍스트에서 태그로 구분 된 여러 인용을 추출하는 방법은 무엇입니까?

  15. 15

    PHP를 사용하여 텍스트 파일에서 특정 정보 추출

  16. 16

    파이썬에서 정규식을 사용하여 두 특정 문자 사이의 첫 번째 정수를 얻는 방법은 무엇입니까?

  17. 17

    Python에서 정규식을 사용하여 특정 값 추출

  18. 18

    정규식을 사용하여 일부 텍스트에서 두 필드를 추출 할 수 없습니다.

  19. 19

    파이썬에서 정규식을 사용하여 문자열에서 여러 개의 연속 문자를 추출하십시오.

  20. 20

    파이썬에서 정규식을 사용하여 알파벳을 제거하고 숫자를 추출하는 방법은 무엇입니까?

  21. 21

    정규식을 사용하여 파일에서 특정 데이터 추출

  22. 22

    정규식을 사용하여 텍스트에서 도움말 추출

  23. 23

    정규식을 사용하여 두 마커 사이의 텍스트 추출

  24. 24

    정규식을 사용하여 특정 조건에서 특정 기호를 캡처 / 그룹화합니까?

  25. 25

    파이썬에서 숫자 범위를 사용하여 Excel 파일에서 특정 값 집합을 추출하는 방법은 무엇입니까?

  26. 26

    C #을 사용하여 텍스트 파일에서 특정 텍스트 추출

  27. 27

    정규식을 사용하여 두 줄 사이에 관련 텍스트를 추출하는 방법

  28. 28

    vs-code : 정규식을 사용하여 열린 여러 파일에 텍스트를 추가 하시겠습니까?

  29. 29

    파이썬을 사용하여 텍스트 파일에서 특정 데이터를 추출하고 CSV에 쓰는 방법

뜨겁다태그

보관