정규식을 적용한 후 단어 사이에 공백을 하나만 남겨 둡니다.

debugcn 에 게시 Dev

카타리나 노게이라

다음과 같은 문자열이 있습니다.
"{{contentious label|Pseudoscience}}This category is..."

특수 문자가없는 문자열이 필요합니다.

cleanedStr = re.sub(r'([^a-zA-Z ]+?)', "", string)

문제는 결과가 다음과 같이 나오고 있다는 것입니다.

contentious labelPseudoscienceThis category   is

그리고 단어 사이에 공백 이 하나만 있는 결과가 필요합니다. 이후 토큰 화하기 위해 각 단어를 빈 공백으로 구분하기 때문입니다.

contentious label Pseudoscience This category is

도움을 주시면 감사하겠습니다. 나는 이미 하나의 공간 만 남겨둔 정규식을 시도했지만 만들 수 없었습니다.

Wiktor Stribiżew

다음을 사용하여 문제를 해결할 수 있습니다.

re.sub(r'[^a-zA-Z]+', ' ', text).strip()

여기에서 문자가 아닌 1 개 이상의 전체 청크를 단일 공백으로 바꾼 다음 strip()결과에서 선행 / 후행 공백 을 제거합니다.

또는

" ".join(re.findall(r'[A-Za-z]+', text))

여기서, re.findall(r'[A-Za-z]+', text)1+ ASCII 문자의 모든 청크 목록을 반환하고 " ".join(...)이러한 목록 항목을 단일 공백으로 구분 된 문자열로 결합합니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

정규식을 적용한 후 단어 사이에 공백을 하나만 남겨 둡니다.

정규식을 적용한 후 단어 사이에 공백을 하나만 남겨 둡니다.

gsub 정규식을 사용하여 이스케이프 된 큰 따옴표 만 남겨 둡니다.

정규식 : 특정 태그 사이에있는 두 개 이상의 공백을 제거하고 대신 공백 만 남겨 둡니다.

공백을 탭으로 변환하지만 중간에 단어 항목 만 남겨 두는 정규식?

Animated를 사용하여 네이티브 반응을 사용하여 헤더 숨기기 (TransformY 뒤에 공백을 남겨 둡니다)

크기가 고정 된 단어의 후행 공백을 허용하는 정규식이 있습니까?

임의의 숫자 데이터를 정렬하고 누락 된 값에 공백을 남겨 둡니다.

Acronis를 사용하여 750GB HDD를 1TB 외부 HD에 백업하고 여유 공간을 남겨 둡니다.

htaccess 다시 작성 URL을 사용하여 / folder /를 제거하고 나머지는 모두 남겨 둡니다.

처음에 공백을 제거하려면 정규식이 필요하며 두 단어 사이에 공백을 허용해야합니다.

주어진 폴더에서 파일을 제거하고 하위 폴더에 파일을 남겨 둡니다.

크롬 하단에 공간을 남겨

문자열에서 모든 것을 제거 .. 숫자 만 남겨 둡니다.

수식을 값으로 변환하기 위해 VBA를 작성해야하지만 첫 번째 열이 비어 있으면 수식으로 남겨 둡니다.

숭고한 텍스트에서 정규 표현식을 사용하여 단어 사이의 공백을 제거하는 방법은 무엇입니까?

C에서 char *에서 여분의 공백을 제거하고 단어 사이에 하나의 공백 만 사용하려고합니다.

이메일에서 디스크로 첨부 파일을 제거하지만 이메일에 첨부 파일에 대한 링크는 남겨 둡니다.

나는 최대 3 자리와 일치하는 정규식을 선택적으로 만들고 싶습니다. 시작 부분에는 최대 4 단어로 시작하고 그 뒤에 공백이있는 최소 한 단어

파일 이름의 문자열을 제거하고 나머지는 BASH에 남겨 둡니다.

단어 사이에 정확히 하나의 공백을 남기시겠습니까?

정규식을 사용하여 특정 단어 중 한 단어 만 일치시킵니다.

후행 공백이있는 단어를 캡처하기 위해 vim syn 정규식을 만드는 방법은 무엇입니까?

각 단계에서 선택한 이미지를 남겨 둡니다.

훈련 과정에서 두 개의 ID를 생략하여 교차 검증을 남겨 둡니다.

C를 사용하여 후행 공백을 제거한 후 문자열이 비어 있습니다.

어디에서나 공백이있는 알파벳 만 허용하려면 정규식에서 무엇을 변경해야합니까?

URL을 제거하고 마지막 부분 만 남겨 둡니다.

정규식을 사용하여 단어 문자열의 모든 알파벳을 가져옵니다 (공백 포함).

vim이 후행 공백을 표시하지만 탭에 공백을 사용하려면 어떻게해야합니까?

단락 내의 다른 태그에 대한 스타일 속성을 제거하고 하나만 스타일로 남겨 두는 방법