내가 붙여 넣을 때 특수 문자 우분투 16.04에서의 gedit로 문자지도에서, 또는 MEDIT을 다음 공백 문자 바로 뒤에 특수 문자 는 "압축"문자 간격으로 표시됩니다.
몇 가지 주요 TABS 뒤에 다음을 입력합니다.
A > B
>
입력 한 문자를 ⯈
붙여 넣어나는 이것을 얻는다 :
다음 공백 ⯈
이 축소 / 압축 되었음을 알 수 있습니다 .
⯈
문자를 삭제하면 공백이 일반 문자 너비로 돌아갑니다.
추가 동작은 다음과 같습니다.
⯈
, 다음 최고의 공간이 있습니다 하지 영향내가 공백 새 줄을 시작하고 붙여 넣기하면 ⯈
, 다음 최고의 공간이있다 또한 영향
보통:
나는이 유니 코드를 Java 문자열 리터럴 변환기로 사용 했으며 공백 ⯈
은 여전히 공백입니다.
문자표의 문자 집합과 글꼴 크기를 Gedit 글꼴 설정과 동일하게 설정했는지 확인했습니다.
이것은 어떤 차이도 만들지 않을 것입니다 – 나도 압니다 – 그러나 나는 온 전성 검사를 위해 그것을했습니다.
이것은 나를 미치게 만든다.
왜 이런 일이 발생하는지에 대한 아이디어가 있습니까?
최신 정보
버그 보고서를 기록했습니다.
더 높은 유니 코드 문자에 대한 Gedit의 지원은 완벽하지 않습니다. gedit에서 보는 것이 반드시 다른 앱에서 얻는 것이 아니라는 점을 이해하십시오. Gedit는 재미 있고 유용한 작은 앱이지만 완벽하지는 않습니다.
버그가 이미보고되었을 것입니다. 아마도 이것들 중 하나일까요? https://bugzilla.gnome.org/buglist.cgi?quicksearch=product%3A%22gedit%22%20utf-8&list_id=272617
당신이 말하는 것과 일치하는 것이 보이지 않습니다. 다음 단계에 따라 새 버그를보고 할 수 있습니다. https://wiki.gnome.org/Apps/Gedit/ReportingBugs
코드를 작성하는 경우 IntelliJ 또는 다른 더 심각한 편집기를 사용해보십시오. vim도 더 잘할 수 있습니다. 나는 테스트했고 귀하의 샘플은 두 가지 모두에서 완벽하게 작동합니다.
3 바이트 UTF-8 문자를 사용하고 있습니다.
e2af88
gedit-버전 3.22.1에서 만든 테스트 파일에서 xxd를 실행했습니다. Juergen Weigert의 xxd V1.10 27oct98도 문자를 올바르게 표시하지 않았지만 cat (GNU coreutils) 8.26은 표시했습니다.
따라서 UTF-8 인코딩을 나타내는 유니 코드 문자로 변환하는 힘든 과정을 살펴 보겠습니다.
Hx Binary
e2 1110 0010
af 1010 1111
88 1000 1000
컨트롤을 제거합니다 (각각은 0으로 끝남).
Ctr Actual bits Ctrl Meaning
1110 0010 1110 means: a three-byte character.
10 101111 10 means: continuation of character.
10 001000 10 means: continuation of character.
실제 비트를 연결하십시오.
0010101111001000
16 진수로 다시 변환 (이 예제에서는 표시 / 문제가되지 않지만 비트 수가 4로 균등하게 나뉘 지 않으면 오른쪽에서 시작하여 4 비트 그룹을 만든 다음 0으로 채워야합니다. 왼쪽) :
Hx Binary
2b 0010 1011
c8 1100 1000
2bc8은 "⯈"또는 "중앙에있는 검은 색 중간 오른쪽을 가리키는 삼각형"U + 2BC8입니다. 따라서 Gedit는 올바른 문자를 저장하고 주위의 공백을 올바르게 표시하지 않습니다.
2bc8이 2014 년 유니 코드 7.0에 추가 된 것 같습니다 : http://unicode.org/cldr/utility/character.jsp?a=2BC8
gedit가 아직 7.0을 완전히 지원하지 않는 것일까 요? 아니면 공백이 3 바이트 UTF-8 문자 근처에서 압축되는 경우가 있습니까?
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다