我找到了解决方案。首先必须将文件转换为utf-8:
iconv -f macintosh -t UTF-8 < INPUT_FILE_PATH
现在,我可以替换非UTF字符了。python3中的一个示例:
replace_table = {
ord('’'): "´",
ord('ì'): '«',
ord('î'): '»',
# to find new spec chars: iconv -f macintosh -t UTF-8 < INPUT_FILE_PATH
}
with open('filename', 'r', encoding='mac_roman', newline='') as f:
[l.translate(replace_table) for l in f.readlines()]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句