특수 문자가 Gedit 또는 medit에서 후행 / 선행 공백 문자의 너비를 변경하는 이유는 무엇입니까?

TaoRich

내가 붙여 넣을 때 특수 문자 우분투 16.04에서의 gedit로 문자지도에서, 또는 MEDIT을 다음 공백 문자 바로 뒤에 특수 문자 는 "압축"문자 간격으로 표시됩니다.

  1. 몇 가지 주요 TABS 뒤에 다음을 입력합니다.

    A     >     B
    
  2. 그런 다음 아래 줄을 복사하여 붙여 넣어 복제합니다.
  3. 이제 >입력 한 문자를 붙여 넣어
  4. 나는 이것을 얻는다 :

    문제의 샘플 이미지

    다음 공백 이 축소 / 압축 되었음을 알 수 있습니다 .

  5. 문자를 삭제하면 공백이 일반 문자 너비로 돌아갑니다.

    문제 테스트의 샘플 이미지

추가 동작은 다음과 같습니다.

  • 나는 "비 공백 문자"와 새 줄을 시작하고 붙여 넣기하면 , 다음 최고의 공간이 있습니다 하지 영향
  • 내가 공백 새 줄을 시작하고 붙여 넣기하면 , 다음 최고의 공간이있다 또한 영향

    문제의 샘플 이미지 more

테스트

  1. 보통:

    • 구글 검색
    • AskUbuntu 검색
    • StackOverflow 검색
  2. 나는이 유니 코드를 Java 문자열 리터럴 변환기로 사용 했으며 공백 은 여전히 ​​공백입니다.

  3. 문자표의 문자 집합과 글꼴 크기를 Gedit 글꼴 설정과 동일하게 설정했는지 확인했습니다.

    이것은 어떤 차이도 만들지 않을 것입니다 – 나도 압니다 – 그러나 나는 온 전성 검사를 위해 그것을했습니다.

  4. Gedit 콘텐츠를 올바른 형식의 HTML 파일에 저장하고 Chrome에서 보았습니다.
    문자 간격이 정상입니다.
  5. LibreOffice Calc의 빈 셀에 Gedit 콘텐츠 복사 / 붙여 넣기 :
    문자 간격 보통-예상대로

이것은 나를 미치게 만든다.

왜 이런 일이 발생하는지에 대한 아이디어가 있습니까?

최신 정보

버그 보고서를 기록했습니다.

GlenPeterson

버그 야

더 높은 유니 코드 문자에 대한 Gedit의 지원은 완벽하지 않습니다. gedit에서 보는 것이 반드시 다른 앱에서 얻는 것이 아니라는 점을 이해하십시오. Gedit는 재미 있고 유용한 작은 앱이지만 완벽하지는 않습니다.

버그가 이미보고되었을 것입니다. 아마도 이것들 중 하나일까요? https://bugzilla.gnome.org/buglist.cgi?quicksearch=product%3A%22gedit%22%20utf-8&list_id=272617

당신이 말하는 것과 일치하는 것이 보이지 않습니다. 다음 단계에 따라 새 버그를보고 할 수 있습니다. https://wiki.gnome.org/Apps/Gedit/ReportingBugs

코드를 작성하는 경우 IntelliJ 또는 다른 더 심각한 편집기를 사용해보십시오. vim도 더 잘할 수 있습니다. 나는 테스트했고 귀하의 샘플은 두 가지 모두에서 완벽하게 작동합니다.

3 바이트 UTF-8 문자

3 바이트 UTF-8 문자를 사용하고 있습니다.

e2af88

gedit-버전 3.22.1에서 만든 테스트 파일에서 xxd를 실행했습니다. Juergen Weigert의 xxd V1.10 27oct98도 문자를 올바르게 표시하지 않았지만 cat (GNU coreutils) 8.26은 표시했습니다.

따라서 UTF-8 인코딩을 나타내는 유니 코드 문자로 변환하는 힘든 과정을 살펴 보겠습니다.

Hx Binary
e2 1110 0010
af 1010 1111
88 1000 1000

컨트롤을 제거합니다 (각각은 0으로 끝남).

Ctr  Actual bits  Ctrl Meaning
1110 0010         1110 means: a three-byte character.
10   101111       10 means: continuation of character.
10   001000       10 means: continuation of character.

실제 비트를 연결하십시오.

0010101111001000

16 진수로 다시 변환 (이 예제에서는 표시 / 문제가되지 않지만 비트 수가 4로 균등하게 나뉘 지 않으면 오른쪽에서 시작하여 4 비트 그룹을 만든 다음 0으로 채워야합니다. 왼쪽) :

Hx Binary
2b 0010 1011
c8 1100 1000

유니 코드 문자

2bc8은 "⯈"또는 "중앙에있는 검은 색 중간 오른쪽을 가리키는 삼각형"U + 2BC8입니다. 따라서 Gedit는 올바른 문자를 저장하고 주위의 공백을 올바르게 표시하지 않습니다.

2bc8이 2014 년 유니 코드 7.0에 추가 된 것 같습니다 : http://unicode.org/cldr/utility/character.jsp?a=2BC8

gedit가 아직 7.0을 완전히 지원하지 않는 것일까 요? 아니면 공백이 3 바이트 UTF-8 문자 근처에서 압축되는 경우가 있습니까?

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

Related 관련 기사

뜨겁다태그

보관