将ISO-8859-1转换为utf-8（øæå）

debugcn 发表于 Dev

咆哮

我有一个包含字母（'øæå'）的txt文档，我希望此脚本能够识别这些字母并将它们正确地写入csv文件。

with codecs.open('transaksjonliste.txt', 'r', 'ISO-8859-1') as file:
    for line in file:

        line = file.readline() 
        lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
        splitTab = lineS.split(';')

        for s in splitTab:
            newS = s[1:-1]

        date = splitTab[0].replace('.', '/')
        insertList = [date,]
        out.writerow(date)

给出：

  File "Q:\DropBox\Development\Scripts\tes2.py", line 17, in <module>
    lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf8 in position 14: invalid start byte

我们

with codecs.open('transaksjonliste.txt', 'r', 'ISO-8859-1') as file:
    for line in file:

        line = file.readline() 
        lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
        splitTab = lineS.split(';')

删除line = file.readline()，您已经在遍历带有for line in file构造的各行。

lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')

不会是您想要的，因为它会编码为ISO-8859-1，然后尝试将ISO-8859-1解码为好像是UTF-8。如果要将“ ISO-8859-1”转换为UTF-8，通常需要

 lineS = line.decode('ISO-8859-1', 'ignore').encode('utf-8')

但是，您已经在codecs.open（）表达式中将数据从“ ISO-8859-1”（转换为unicode）转换了。所以你只需要做

  lineS = = line.encode('utf-8')

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-8

我来说两句

0条评论

登录后参与评论

来自分类Dev

将iso-8859-1转换为utf-8 javascript

来自分类Dev

Javascript将字符串从utf-8转换为iso-8859-1

来自分类Dev

将SQL Server中的文本值从UTF8转换为ISO 8859-1

来自分类Dev

从UTF8转换为ISO 8859-5，改为获取ISO 8859-1

来自分类Dev

如何在Ruby 2.0中将UTF-8转换为ISO-8859-1？

来自分类Dev

将字符从ISO-8859-1转换为Javascript中的UTF-8编码时，保持字符表示

来自分类Dev

Symfony2 + Doctrine：如何将iso8859-1转换为utf-8，反之亦然？

来自分类Dev

Ruby将字符串编码从ISO-8859-1转换为UTF-8无效

来自分类Dev

jQuery或Javascript：从ISO-8859-1转换为utf8

来自分类Dev

在Delphi中将UTF8转换为ANSI（ISO-8859-1）

来自分类Dev

将UTF-8转换为ISO-8859-2（抛光）

来自分类Dev

从UTF-8转换为ISO8859-1并重新转换为UTF-8后，符号会丢失

来自分类Dev

从utf8转换为iso-8859-1后未显示丹麦语字符

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

从ISO-8859-1转换大型XML为UTF-8与外部DTD实体

来自分类Dev

将（txt | srt）文档从Western（ISO-8859-15）转换为UTF-8

来自分类Dev

从 Linux 终端将 ISO-8859-7 转换为 utf-8 而无需 bom

来自分类Dev

如何将 iso8859_6 中的文件名转换为 utf-8？

来自分类Dev

如何将ISO-8859-1字符正确替换为UTF-8？

来自分类Dev

从 UTF8 转换为 ISO-8859-1 不起作用

来自分类Dev

从UTF-8转换为ISO-8859-15时，哪些双引号字符会自动替换？

来自分类Dev

如何从C中的八进制ISO-8859-1转储utf8

来自分类Dev

根据.procmailrc文件中的文本将utf8解码为ISO-8859-1邮件

来自分类Dev

ASP：我无法将某些字符从utf-8解码为iso-8859-1

来自分类Dev

ASP：我无法将某些字符从utf-8解码为iso-8859-1

来自分类Dev

字符编码问题-UTF8 / iso-8859-1

来自分类Dev

DB是iso-8859-1，使用utf8_encode字符获取错误的转换

来自分类Dev

从ISO-8859-2转换为ORACLE字符集AL16UTF16

Related 相关文章

文章