utf-8以外の文字を読み取るために使用する必要があるPythonエンコーディングタイプはどれですか？

debugcn 投稿 Dev

648トリンダーデ

PythonスクリプトにDNAクエリ文字列ファイルを読み取らせて検索する必要があります。

このファイルには、次のタイプの文字が含まれています。

スクリーンショット

また、Pythonのデフォルトのエンコーディングでは、ファイルのreadline（）関数を使用してこの行を読み取ることはできません。次のエラーが発生します。

[...]
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 860: invalid start byte

utf_16とasciiも試してみましたが、良い結果は得られませんでした。どうすればこれを読むことができますか？

メタトースター

最初に、読み取る必要のあるテキストファイルの実際のエンコーディングを把握してから、openそのファイルと正しいencoding引数を使用してそれを開く必要があります。ダイヤモンド？はコンソールの単なるプレースホルダー文字であるため、デフォルトのシステムエンコーディングは表示したファイルと互換性がありません（またはその逆）。

あなたは、単にできる「ジャンク」の文字を気にしない代わり場合'ignore'または'replace'のためのerrors引数。利用可能なオプションについては、最初にドキュメントを参照してください。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-3

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

utf-8以外の文字を読み取るために使用する必要があるPythonエンコーディングタイプはどれですか？

utf-8以外の文字を読み取るために使用する必要があるPythonエンコーディングタイプはどれですか？

utf-8以外のエンコーディングでcharlistを読み取る

SparkはUTF-8以外のエンコーディングでwholeTextFilesを読み取ります

Rest APIは応答をプレーンな文字列として送信しますが、コンテンツタイプは「application / json; charset = UTF-8」です。応答を読み取るにはどうすればよいですか

印刷可能なASCII文字をUTF-8エンコーディングファイルとの間で読み書きするにはどうすればよいですか？

Python-UTF-8でエンコードされた文字列をバイトごとに読み取る

Maven Javaコンパイラプラグインを1.5から1.6に変更すると、UTF-8をエンコードするためにマップできない文字が表示されるのはなぜですか？

UNIX / Linux環境とやり取りするときにUTF-8エンコーディングが使用されるのはなぜですか？

postgres UTF8クライアントエンコーディングで「€」（u + 20AC）文字を取得するにはどうすればよいですか？

ヘッドとメモ帳が読み取れるバイナリエンコーディングをUTF-8に変換します

utf8以外のエンコーディングを使用するMySQLSUBSTRING（）

文字列内のutf8エンコーディングを簡単に検出するにはどうすればよいですか？

PHPの連絡フォームでUTF-8エンコーディングを設定するにはどうすればよいですか。ラテン文字のみが正しく表示されます

UTF-16エンコーディングを使用してパイプからPowerShell出力を読み取る

UTF-8エンコーディングでSQLiteODBCドライバーを使用するにはどうすればよいですか？

VMはlatin1のネイティブ名エンコーディングで実行されているため、utf8を想定しているためElixirが誤動作する可能性があります

JavaはUTF-8またはUTF-16をどのエンコーディングで使用しますか？

CRLFラインターミネータを使用した非ISO拡張ASCIIテキストからUTF-8にエンコーディングを変更するにはどうすればよいですか？

`wifstream`の` getline`がUTF-16エンコードファイルから文字化けした入力を読み取るのはなぜですか？

MySQLでutf8エンコーディングに適さない不良文字を削除するにはどうすればよいですか？

JavaアプリケーションはUTF-8でエンコードされたテキストファイルを読み取りますが、antビルド後に文字が期待どおりではありません

長すぎるUTF-8エンコーディングはどのように生成されますか？

UTF-8エンコーディングでXMLファイルを読み取る

ncursesでキーボードからUTF-8でエンコードされた文字を読み取る

VIMのデフォルトのエンコーディングをUTF-8に設定するにはどうすればよいですか？

CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか？

CSVをアップロードしてUTF-8エンコーディングで表示するにはどうすればよいですか？

JSONファイル処理エラー：UTF-8エンコーディングでファイルを使用する場合、JSONArrayテキストは1 [文字2行1]で「[」で始まる必要があります

Pythonで壊れたutf-8エンコーディングを修正する方法は？

iOS-CocoaPodsでは、端末でUTF-8エンコーディングを使用する必要があります-最新のフラッターアップグレード後