특정 단어가 포함 된 문장을 제외하는 방법

debugcn 에 게시 Dev

비마 센

엑셀 (바이오 데이터 포함) 파일에서 문장을 읽고 있는데 그들이 일하고있는 조직을 추출하고 싶습니다. 파일에는 그 사람이 공부하는 곳을 지정하는 문장도 포함되어 있습니다. 예 :

나는 'x'instition (대학)에서 공부하고 있습니다.
나는 'y'대학의 학생

이런 유형의 문장을 건너 뛰고 싶습니다.

이 문장을 일치시키기 위해 정규식을 사용하고 있으며 학생과 관련된 경우 부분을 건너 뛰고 별도의 Excel 파일에 작성하려는 다른 줄 만 사용합니다.

내 코드는 아래와 같습니다 ..

csvdata = pandas.read_csv ( "filename.csv", ","); csvdata의 데이터 :

        regEX=re.compile('|'.join([r'\bstudent\b',r'\bstudy[ing]\b']),re.I)
        matched_data=re.match(regEX,data)   
        if matched_data is not None:
            continue

        else:
            ## write the sentence to excel

그런데 새로 생성 된 엑셀 파일을 확인해 보니 여전히 'student', 'study'가 포함 된 문장이 들어 있습니다. 결과를 얻기 위해 정규식을 수정하는 방법.

Wiktor Stribiżew

여기에는 두 가지가 있습니다.

1) 사용 re.search( re.match문자열 시작에서만 검색)
2) 정규식은regEX=re.compile(r"\b(?:{})\b".format('|'.join([r'student',r'study(?:ing)?'])),re.I)

는 [ing]단 하나, 1 개 기호를 일치 i, n또는 g의도하는 동안 일치 옵션 ing 결말. ?수량 자-- 가있는 비 캡처 그룹 (?:ing)?은 실제로 ings의 1 개 또는 0 개 시퀀스와 일치 합니다.

또한 역 추적 단계가 더 적기 때문에는 \b(x|y)\b보다 효율적인 패턴 \bx\b|\by\b입니다.

다음은 이 정규식이 어떻게 생겼는지에 대한 데모 입니다.

import re
pat = r"\b(?:{})\b".format('|'.join([r'student',r'study(?:ing)?']))
print(pat)
# => \b(?:student|study(?:ing)?)\b
regEX=re.compile(pat,re.I)
s = "He is studying here."
mObj = regEX.search(s)
if mObj: 
    print(mObj.group(0))
# => studying

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-8

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

특정 단어가 포함 된 문장을 제외하는 방법

특정 단어가 포함 된 문장을 제외하는 방법

특정 단어가 포함 된 postgreSQL 행을 선택하는 방법

Excel에서 특정 단어가 포함 된 셀 값을 에코하는 방법

grep --recursive 사용, '원치 않는'및 '원하는'단어가 포함 된 특정 줄을 제외하는 방법은 무엇입니까?

특정 구문이 포함 된 줄을 삭제하는 방법은 있지만 다른 단어가 포함 된 줄을 피하고 싶습니다.

특정 단어가 포함 된 목록에서 항목을 제거하는 효율적인 방법?

인스턴스 이름에 특정 단어가 포함 된 영화 클립을 제거하는 방법

큰 텍스트 파일에서 특정 단어가 포함 된 줄을 찾는 가장 빠른 방법

특정 단어가 포함 된 범위를 찾는 방법

ajax 검색 특정 구문에 검색된 단어가 포함되어 있는지 확인하는 방법

특정 단어가 포함 된 문서를 계산하는 방법은 무엇입니까?

특정 문자가 포함 된 모든 단어를 grep하는 방법은 무엇입니까?

특정 단어가 포함 된 HTML 페이지에서 줄의 색상을 변경하는 방법

특정 단어가 포함 된 파일을 검색하는 방법은 무엇입니까?

특정 태그가 포함 된 XML을 확인하는 방법

특수 단어가 포함 된 첫 번째 줄을 인쇄하는 방법

특정 문자가 포함 된 목록에서 단어 제거

특정 문자가 포함 된 경우 단어 제거

문자 또는 단어가 포함 된 행을 제거하는 방법

특정 단어가 포함 된 .doc 파일을 재귀 적으로 찾는 방법은 무엇입니까?

특정 문자가 포함 된 열만 찾을 수있는 방법

터미널을 통해 특정 단어가 포함 된 텍스트 파일에서 줄을 제거하는 방법은 무엇입니까?

터미널을 통해 특정 단어가 포함 된 텍스트 파일에서 줄을 제거하는 방법은 무엇입니까?

단어에 특정 문자가 포함 된 경우 true를 반환하는 IF 문

특수 문자로 시작하는 단어가 포함 된 정규식 \ b

특수 문자가 포함 된 정확히 일치하는 단어 바꾸기

문장의 배열에서 특정 단어를 찾아 단어가 포함 된 문장을 반환

특정 줄에 특정 단어가 포함 된 모든 텍스트 그룹을 일치시키는 방법은 무엇입니까?

특정 단어가 포함 된 행을 선택하여 백분율 결정

정규식을 사용하여 특정 단어가 포함 된 블록 찾기