文字列内の対応するグリフとともに unicode コードポイントを追加します。

debugcn 投稿 Dev

ユーザー7623610

私はPythonに文字列を持っています

set = "U+06A4, U+06A7, U+06A8, U+06A9, U+06AF"

U+この文字列で始まるすべての単語を見つけて、それらに対応するグリフを追加したいと思います。

たとえば、

word_found_in_string = 'U+064A'

と交換したい

replace_with = 'U+064A chr(int(word_found_in_string[2:6],16))'

wherechr(int(word_found_in_string[2:6],16))は、対応するグリフを出力ファイルに出力します。

reモジュールを使用して、文字列内のすべての unicode コードポイントに対してこれを行うにはどうすればよいでしょうか。

マーク・トロネン

re.sub交換用の機能をとることができます。ここではラムダ関数を使用します。正規表現が一致するたびに、一致オブジェクトとともに呼び出されます。m.group(0)は完全一致でありm.group(1)、4 桁の 16 進数に一致する括弧で囲まれた式です。

import re
s = 'U+06A4, U+06A7, U+06A8, U+06A9, U+06AF'
s = re.sub(r'U\+([0-9A-F]{4})',lambda m: m.group(0)+' '+chr(int(m.group(1),16)),s)
print(s)

出力：

U+06A4 ڤ, U+06A7 ڧ, U+06A8 ڨ, U+06A9 ک, U+06AF گ

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-29

コメントを追加

サインイン

分類Dev

PythonでUnicodeコードポイントを表す文字列からUnicode文字を取得しますか？

分類Dev

バイトをUnicode文字列としてデコードする

分類Dev

zshで文字のUnicodeコードポイントを取得する

分類Dev

Pythonを使用して文字のUnicodeコードポイントを取得する

分類Dev

Pythonを使用して文字のUnicodeコードポイントを取得する

分類Dev

Unicodeコードポイントのリストが与えられた場合、それらをUnicode文字のリストにどのように分割しますか？

分類Dev

文字列を「Unicodeコードポイントのシーケンス」として保存するにはどうすればよいですか？

分類Dev

Java文字列のUnicodeコードポイントをどのように反復できますか？

分類Dev

Java / Kotlinで文字列を同等であるが異なるUnicodeコードポイントと比較する

分類Dev

PythonでUnicodeコードポイントから実際のUnicode文字列に変換する方法は？

分類Dev

Javaで拡張ASCIIコードポイントとコードページを指定して、同等のUnicodeコードポイントを見つけるには？

分類Dev

PythonでコードポイントのUnicodeバージョンを取得する

分類Dev

バイトを印刷可能なUnicode文字列としてエンコードする方法（asciiのbase64など）

分類Dev

Rubyで％uXXXXを対応するUnicodeコードポイントに置き換える

分類Dev

崇高なテキストのコードポイントを使用してUnicode文字を検索する方法

分類Dev

CharacterはすべてのUnicodeコードポイントを表すことができますか？

分類Dev

大文字と小文字を区別する操作の結果に表示できないUnicodeコードポイントはいくつありますか？

分類Dev

文字列にUnicodeコードポイントと16進値が混在しているように見えるバイナリファイルを解析するにはどうすればよいですか？

分類Dev

golangで絵文字を使って文字列を処理する（無効なUnicodeコードポイントをデコードまたは削除する）方法は？

分類Dev

PythonがUnicode文字列を自動的にエンコードしようとするのはなぜですか？

分類Dev

AwesomeFontのカスタムフォントとJava SwingのUnicode文字を使用してJButtonにアイコンを追加しますか？

分類Dev

文字列Unicodeエンコーディングをオンにするとエラーが発生します

分類Dev

juliaで文字列をUnicodeとしてエンコードする方法は？

分類Dev

ファイル内のUnicode入力文字列とUnicodeデータの比較を解決する

分類Dev

Javascriptで文字のUnicodeコードポイントを取得するにはどうすればよいですか？

分類Dev

アラビア文字には、文字列内の位置に基づいて異なるUnicodeコードポイントがありますか？

分類Dev

コードポイントのシーケンスがUnicode文字を形成する場合、そのシーケンスの空でないプレフィックスもすべて有効な文字を形成しますか？

分類Dev

文字列内の対応するグリフとともに unicode コード ポイントを追加します。

文字列内の対応するグリフとともに unicode コード ポイントを追加します。

PythonでUnicodeコードポイントを表す文字列からUnicode文字を取得しますか？

バイトをUnicode文字列としてデコードする

zshで文字のUnicodeコードポイントを取得する

Pythonを使用して文字のUnicodeコードポイントを取得する

Pythonを使用して文字のUnicodeコードポイントを取得する

Unicodeコードポイントのリストが与えられた場合、それらをUnicode文字のリストにどのように分割しますか？

文字列を「Unicodeコードポイントのシーケンス」として保存するにはどうすればよいですか？

Java文字列のUnicodeコードポイントをどのように反復できますか？

Java / Kotlinで文字列を同等であるが異なるUnicodeコードポイントと比較する

PythonでUnicodeコードポイントから実際のUnicode文字列に変換する方法は？

Javaで拡張ASCIIコードポイントとコードページを指定して、同等のUnicodeコードポイントを見つけるには？

PythonでコードポイントのUnicodeバージョンを取得する

バイトを印刷可能なUnicode文字列としてエンコードする方法（asciiのbase64など）

Rubyで％uXXXXを対応するUnicodeコードポイントに置き換える

崇高なテキストのコードポイントを使用してUnicode文字を検索する方法

CharacterはすべてのUnicodeコードポイントを表すことができますか？

大文字と小文字を区別する操作の結果に表示できないUnicodeコードポイントはいくつありますか？

文字列にUnicodeコードポイントと16進値が混在しているように見えるバイナリファイルを解析するにはどうすればよいですか？

golangで絵文字を使って文字列を処理する（無効なUnicodeコードポイントをデコードまたは削除する）方法は？

PythonがUnicode文字列を自動的にエンコードしようとするのはなぜですか？

AwesomeFontのカスタムフォントとJava SwingのUnicode文字を使用してJButtonにアイコンを追加しますか？

文字列Unicodeエンコーディングをオンにするとエラーが発生します

juliaで文字列をUnicodeとしてエンコードする方法は？

ファイル内のUnicode入力文字列とUnicodeデータの比較を解決する

Javascriptで文字のUnicodeコードポイントを取得するにはどうすればよいですか？

アラビア文字には、文字列内の位置に基づいて異なるUnicodeコードポイントがありますか？

コードポイントのシーケンスがUnicode文字を形成する場合、そのシーケンスの空でないプレフィックスもすべて有効な文字を形成しますか？

Haskeroは「有効なUnicodeコードポイントではありません！」で失敗します。

ポーランド語文字のXPagesにUnicodeメタタグを追加する

文字列内の対応するグリフとともに unicode コードポイントを追加します。

文字列内の対応するグリフとともに unicode コードポイントを追加します。