一个朋友在处理一堆被重命名为乱码的文件时遇到了麻烦。看起来像这样:
03-ñîáä-áøâì-ùîàì.mp3
什么时候应该看起来像这样:
03-סמבה-ברגל-שמאל.mp3
现在,文件数量巨大,因此他问我是否可以使用python脚本。我开始干预,但不会让步。我的假设是,它是一台CP-1255(或windows-1255
),显示为utf-8
,所以我尝试了:
fname.decode('utf-8').encode('windows-1255')
但是我收到“无法编码字符”错误。于是,我又试图切换他们,也试过latin-1
,windows-1252
,cp862
甚至ISO-8859-8
。没有什么。
我该怎么办?编码一直让我感到困惑。我该如何处理?
我正在使用python 2.7
您几乎是正确的,但是原始编码是windows-1252
,不是utf-8
。
>>> print u'03-ñîáä-áøâì-ùîàì.mp3'.encode('cp1252').decode('cp1255')
03-סמבה-ברגל-שמאל.mp3
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句