次のような特定の特殊文字を含む文字列を記述している間
Töölönlahdenkatu
パンダのto_csvを使用すると、csvの結果は次のようになります。
T%C3%B6%C3%B6l%C3%B6nlahdenkatu
文字列のテキストをそのまま書くにはどうすればよいですか?これは私のto_csvコマンドです
df.to_csv(csv_path,index=False,encoding='utf8')
私も試しました
df.to_csv(csv_path,index=False,encoding='utf-8')
df.to_csv(csv_path,index=False,encoding='utf-8-sig')
それでも成功しません。ランダムな記号に置き換えられた他の文字があります
'-' to –
回避策はありますか?
あなたがしようとしているのは、ドイツのウムラウトとスペインのチルダを取り除くことです。そのための簡単な解決策があります。
import unicodedata
data = u'Töölönlahdenkatu Adiós Pequeño'
english = unicodedata.normalize('NFKD', data).encode('ASCII', 'ignore')
print(english)
出力:b'Toolonlahdenkatu Adios Pequeno '
それが機能するかどうか、またはエッジケースがあるかどうかを教えてください。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加