저는 다양한 글꼴로 작업하고 있으며 이러한 각 기호에 대해 특별한 처리를하고 있기 때문에 텍스트 글꼴의 모든 따옴표와 아포스트로피 항목을 표준화하고 싶습니다.
이 항목과 비슷한 줄 건너 뛰기를 찾고 있습니다.
content=re.sub(r'\u000D\u000A|[\u000A\u000B\u000C\u000D\u0085\u2028\u2029]', '\n', content)
또는 하이픈
content = regex.sub(r'\p{Pd}+', '-', content)
도와주세요?
Uniview 도구 를 사용하는 경우 "작은 따옴표", "큰 따옴표", "아포스트로피"에 대한 참조를 포함하는 모든 유니 코드 기호를 검색 할 수 있습니다.
다음은 다소 정리 된 출력입니다.
작은 따옴표[\u02BB\u02BC\u066C\u2018-\u201A\u275B\u275C]
( 데모 참조 ) :
ʻ
-02BB 수정 자 편지가 쉼표로 바뀌 었습니다.ʼ
-02BC 수정 자 편지 아포스트로피٬
-066C 아랍어 천 단위 분리기‘
-2018 왼쪽 단일 따옴표’
-2019 RIGHT SINGLE 따옴표‚
-201A SINGLE LOW-9 따옴표❛
-275B HEAVY SINGLE TURNED COMMA QUOTATION MARK ORNAMENT❜
-275C 무거운 단일 쉼표 따옴표 장식큰 따옴표[\u201C-\u201E\u2033\u275D\u275E\u301D\u301E]
( 데모 참조 ) :
“
-201C 왼쪽 이중 따옴표”
-201D 오른쪽 이중 따옴표„
-201E DOUBLE LOW-9 따옴표″
-2033 더블 프라임❝
-275D HEAVY DOUBLE TURNED COMMA QUOTATION MARK ORNAMENT❞
-275E HEAVY DOUBLE COMMA QUOTATION MARK ORNAMENT〝
-301D REVERSED DOUBLE PRIME QUOTATION MARK〞
-301E DOUBLE PRIME 따옴표아포스트로피[\u0027\u02B9\u02BB\u02BC\u02BE\u02C8\u02EE\u0301\u0313\u0315\u055A\u05F3\u07F4\u07F5\u1FBF\u2018\u2019\u2032\uA78C\uFF07]
( 데모 참조 ) :
'
-0027 아포스트로피ʹ
-02B9 수정 자 레터 프라임ʻ
-02BB 수정 자 문자가 쉼표로 바뀌 었습니다.ʼ
-02BC 수정 자 편지 아포스트로피ʾ
-02BE 수정 자 레터 우측 하프링ˈ
-02C8 수정 자 레터 수직선ˮ
-02EE 수정 자 편지 DOUBLE APOSTROPHÉ
-0301 결합 급성 악센트̓
-0313 위의 콤마 결합̕
-0315 오른쪽 위 콤마 결합՚
-055A 아르메니아 아포스트로피׳
-05F3 HEBREW PUNCTUATION GERESHߴ
-07F4 NKO 하이톤 아포스트로피ߵ
-07F5 NKO LOW TONE APOSTROPHE᾿
-1FBF 그리스 PSILI‘
-2018 왼쪽 단일 따옴표’
-2019 RIGHT SINGLE 따옴표′
-2032 프라임ꞌ
-A78C 라틴 소문자 살 티요'
-FF07 FULLWIDTH APOSTROPHE이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다