无法使用Python将阿拉伯语解码的Unicode保存到CSV文件

Joseph P Nardone 发表于 Dev

约瑟夫·纳尔东

我正在使用适用于python的twitter流包。我目前正在使用以unicode编写的关键字来搜索包含该单词的推文。然后，我使用python创建推文的数据库csv文件。但是，当我将推文保存到csv中时，我想将它们转换回阿拉伯符号。

我收到的错误都类似于“ ____位置上的ASCII字符不在128范围内的ondata错误”。

这是我的代码：

class listener(StreamListener):
    def on_data(self, data):
        try:
            #print data

            tweet = (str((data.split(',"text":"')[1].split('","source')[0]))).encode('utf-8')
            now = datetime.now()
            tweetsymbols =  tweet.encode('utf-8')
            print tweetsymbols

            saveThis = str(now) + ':::' + tweetsymbols.decode('utf-8')
            saveFile = open('rawtwitterdata.csv','a')
            saveFile.write(saveThis)
            saveFile.write('\n')
            saveFile.close()
            return True

阿里·萨伊德·奥马尔

这是一段在文本中写阿拉伯语的片段

# coding=utf-8
import codecs
from datetime import datetime

class listener(object):


    def on_data(self, tweetsymbols):
        # python2
        # tweetsymbols is str
        # tweet = (str((data.split(',"text":"')[1].split('","source')[0]))).encode('utf-8')
        now = datetime.now()
        # work with unicode
        saveThis = unicode(now) + ':::' + tweetsymbols.decode('utf-8')
        try:
            saveFile = codecs.open('rawtwitterdata.csv', 'a', encoding="utf8")
            saveFile.write(saveThis)
            saveFile.write('\n')
        finally:
            saveFile.close()
        return self


listener().on_data("إعلان يونيو وبالرغم تم. المتحدة")