一部の非ASCII文字を含むxmlを解析しようとしています。
コードは以下のようになります
from lxml import etree
from lxml import objectify
content = u'<?xml version="1.0" encoding="utf-8"?><div>Order date : 05/08/2013 12:24:28</div>'
mail.replace('\xa0',' ')
xml = etree.fromstring(mail)
しかし、「content = ...」の行にエラーが表示されます
syntaxError: Non-ASCII character '\xc2' in file /home/projects/ztest/responce.py on line 3,
but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
ターミナルでは機能していますが、Eclipse IDEで実行しているときにエラーが発生します。
克服する方法がわからない。
ソースコードエンコーディングを定義し、これをスクリプトの先頭に追加する必要があります:
# -*- coding: utf-8 -*-
コンソールとIDEで動作が異なる理由は、デフォルトのエンコーディングセットが異なるためと考えられます。次のコマンドを実行して確認できます。
import sys
print sys.getdefaultencoding()
こちらもご覧ください:
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加