utf-8以外の文字を読み取るために使用する必要があるPythonエンコーディングタイプはどれですか?

648トリンダーデ

PythonスクリプトにDNAクエリ文字列ファイルを読み取らせて検索する必要があります。

このファイルには、次のタイプの文字が含まれています。

スクリーンショット

また、Pythonのデフォルトのエンコーディングでは、ファイルのreadline()関数を使用してこの行を読み取ることはできません。次のエラーが発生します。

[...]
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 860: invalid start byte

utf_16とasciiも試してみましたが、良い結果は得られませんでした。どうすればこれを読むことができますか?

メタトースター

最初に、読み取る必要のあるテキストファイルの実際のエンコーディングを把握してから、openそのファイルと正しいencoding引数を使用してそれを開く必要があります。ダイヤモンド ?はコンソールの単なるプレースホルダー文字であるため、デフォルトのシステムエンコーディングは表示したファイルと互換性がありません(またはその逆)。

あなたは、単にできる「ジャンク」の文字を気にしない代わり場合'ignore'または'replace'のためのerrors引数。利用可能なオプションについては、最初にドキュメントを参照してください。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

utf-8以外のエンコーディングでcharlistを読み取る

分類Dev

SparkはUTF-8以外のエンコーディングでwholeTextFilesを読み取ります

分類Dev

Rest APIは応答をプレーンな文字列として送信しますが、コンテンツタイプは「application / json; charset = UTF-8」です。応答を読み取るにはどうすればよいですか

分類Dev

印刷可能なASCII文字をUTF-8エンコーディングファイルとの間で読み書きするにはどうすればよいですか?

分類Dev

Python-UTF-8でエンコードされた文字列をバイトごとに読み取る

分類Dev

Maven Javaコンパイラプラグインを1.5から1.6に変更すると、UTF-8をエンコードするためにマップできない文字が表示されるのはなぜですか?

分類Dev

UNIX / Linux環境とやり取りするときにUTF-8エンコーディングが使用されるのはなぜですか?

分類Dev

postgres UTF8クライアントエンコーディングで「€」(u + 20AC)文字を取得するにはどうすればよいですか?

分類Dev

ヘッドとメモ帳が読み取れるバイナリエンコーディングをUTF-8に変換します

分類Dev

utf8以外のエンコーディングを使用するMySQLSUBSTRING()

分類Dev

文字列内のutf8エンコーディングを簡単に検出するにはどうすればよいですか?

分類Dev

PHPの連絡フォームでUTF-8エンコーディングを設定するにはどうすればよいですか。ラテン文字のみが正しく表示されます

分類Dev

UTF-16エンコーディングを使用してパイプからPowerShell出力を読み取る

分類Dev

UTF-8エンコーディングでSQLiteODBCドライバーを使用するにはどうすればよいですか?

分類Dev

VMはlatin1のネイティブ名エンコーディングで実行されているため、utf8を想定しているためElixirが誤動作する可能性があります

分類Dev

JavaはUTF-8またはUTF-16をどのエンコーディングで使用しますか?

分類Dev

CRLFラインターミネータを使用した非ISO拡張ASCIIテキストからUTF-8にエンコーディングを変更するにはどうすればよいですか?

分類Dev

`wifstream`の` getline`がUTF-16エンコードファイルから文字化けした入力を読み取るのはなぜですか?

分類Dev

MySQLでutf8エンコーディングに適さない不良文字を削除するにはどうすればよいですか?

分類Dev

JavaアプリケーションはUTF-8でエンコードされたテキストファイルを読み取りますが、antビルド後に文字が期待どおりではありません

分類Dev

長すぎるUTF-8エンコーディングはどのように生成されますか?

分類Dev

UTF-8エンコーディングでXMLファイルを読み取る

分類Dev

ncursesでキーボードからUTF-8でエンコードされた文字を読み取る

分類Dev

VIMのデフォルトのエンコーディングをUTF-8に設定するにはどうすればよいですか?

分類Dev

CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか?

分類Dev

CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか?

分類Dev

JSONファイル処理エラー:UTF-8エンコーディングでファイルを使用する場合、JSONArrayテキストは1 [文字2行1]で「[」で始まる必要があります

分類Dev

Pythonで壊れたutf-8エンコーディングを修正する方法は?

分類Dev

iOS-CocoaPodsでは、端末でUTF-8エンコーディングを使用する必要があります-最新のフラッターアップグレード後

Related 関連記事

  1. 1

    utf-8以外のエンコーディングでcharlistを読み取る

  2. 2

    SparkはUTF-8以外のエンコーディングでwholeTextFilesを読み取ります

  3. 3

    Rest APIは応答をプレーンな文字列として送信しますが、コンテンツタイプは「application / json; charset = UTF-8」です。応答を読み取るにはどうすればよいですか

  4. 4

    印刷可能なASCII文字をUTF-8エンコーディングファイルとの間で読み書きするにはどうすればよいですか?

  5. 5

    Python-UTF-8でエンコードされた文字列をバイトごとに読み取る

  6. 6

    Maven Javaコンパイラプラグインを1.5から1.6に変更すると、UTF-8をエンコードするためにマップできない文字が表示されるのはなぜですか?

  7. 7

    UNIX / Linux環境とやり取りするときにUTF-8エンコーディングが使用されるのはなぜですか?

  8. 8

    postgres UTF8クライアントエンコーディングで「€」(u + 20AC)文字を取得するにはどうすればよいですか?

  9. 9

    ヘッドとメモ帳が読み取れるバイナリエンコーディングをUTF-8に変換します

  10. 10

    utf8以外のエンコーディングを使用するMySQLSUBSTRING()

  11. 11

    文字列内のutf8エンコーディングを簡単に検出するにはどうすればよいですか?

  12. 12

    PHPの連絡フォームでUTF-8エンコーディングを設定するにはどうすればよいですか。ラテン文字のみが正しく表示されます

  13. 13

    UTF-16エンコーディングを使用してパイプからPowerShell出力を読み取る

  14. 14

    UTF-8エンコーディングでSQLiteODBCドライバーを使用するにはどうすればよいですか?

  15. 15

    VMはlatin1のネイティブ名エンコーディングで実行されているため、utf8を想定しているためElixirが誤動作する可能性があります

  16. 16

    JavaはUTF-8またはUTF-16をどのエンコーディングで使用しますか?

  17. 17

    CRLFラインターミネータを使用した非ISO拡張ASCIIテキストからUTF-8にエンコーディングを変更するにはどうすればよいですか?

  18. 18

    `wifstream`の` getline`がUTF-16エンコードファイルから文字化けした入力を読み取るのはなぜですか?

  19. 19

    MySQLでutf8エンコーディングに適さない不良文字を削除するにはどうすればよいですか?

  20. 20

    JavaアプリケーションはUTF-8でエンコードされたテキストファイルを読み取りますが、antビルド後に文字が期待どおりではありません

  21. 21

    長すぎるUTF-8エンコーディングはどのように生成されますか?

  22. 22

    UTF-8エンコーディングでXMLファイルを読み取る

  23. 23

    ncursesでキーボードからUTF-8でエンコードされた文字を読み取る

  24. 24

    VIMのデフォルトのエンコーディングをUTF-8に設定するにはどうすればよいですか?

  25. 25

    CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか?

  26. 26

    CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか?

  27. 27

    JSONファイル処理エラー:UTF-8エンコーディングでファイルを使用する場合、JSONArrayテキストは1 [文字2行1]で「[」で始まる必要があります

  28. 28

    Pythonで壊れたutf-8エンコーディングを修正する方法は?

  29. 29

    iOS-CocoaPodsでは、端末でUTF-8エンコーディングを使用する必要があります-最新のフラッターアップグレード後

ホットタグ

アーカイブ