将ISO-8859-1转换为utf-8(øæå)

咆哮

我有一个包含字母('øæå')的txt文档,我希望此脚本能够识别这些字母并将它们正确地写入csv文件。

with codecs.open('transaksjonliste.txt', 'r', 'ISO-8859-1') as file:
    for line in file:

        line = file.readline() 
        lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
        splitTab = lineS.split(';')

        for s in splitTab:
            newS = s[1:-1]

        date = splitTab[0].replace('.', '/')
        insertList = [date,]
        out.writerow(date)

给出:

  File "Q:\DropBox\Development\Scripts\tes2.py", line 17, in <module>
    lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf8 in position 14: invalid start byte
我们
with codecs.open('transaksjonliste.txt', 'r', 'ISO-8859-1') as file:
    for line in file:

        line = file.readline() 
        lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')
        splitTab = lineS.split(';')

删除line = file.readline(),您已经在遍历带有for line in file构造的各行

lineS = line.encode('ISO-8859-1', 'ignore').decode('utf-8')

不会是您想要的,因为它会编码为ISO-8859-1,然后尝试将ISO-8859-1解码为好像是UTF-8。如果要将“ ISO-8859-1”转换为UTF-8,通常需要

 lineS = line.decode('ISO-8859-1', 'ignore').encode('utf-8')

但是,您已经在codecs.open()表达式中将数据从“ ISO-8859-1”(转换为unicode)转换了。所以你只需要做

  lineS = = line.encode('utf-8')

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将iso-8859-1转换为utf-8 javascript

来自分类Dev

Javascript将字符串从utf-8转换为iso-8859-1

来自分类Dev

将SQL Server中的文本值从UTF8转换为ISO 8859-1

来自分类Dev

从UTF8转换为ISO 8859-5,改为获取ISO 8859-1

来自分类Dev

如何在Ruby 2.0中将UTF-8转换为ISO-8859-1?

来自分类Dev

将字符从ISO-8859-1转换为Javascript中的UTF-8编码时,保持字符表示

来自分类Dev

Symfony2 + Doctrine:如何将iso8859-1转换为utf-8,反之亦然?

来自分类Dev

Ruby将字符串编码从ISO-8859-1转换为UTF-8无效

来自分类Dev

jQuery或Javascript:从ISO-8859-1转换为utf8

来自分类Dev

在Delphi中将UTF8转换为ANSI(ISO-8859-1)

来自分类Dev

将UTF-8转换为ISO-8859-2(抛光)

来自分类Dev

从UTF-8转换为ISO8859-1并重新转换为UTF-8后,符号会丢失

来自分类Dev

从utf8转换为iso-8859-1后未显示丹麦语字符

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

从ISO-8859-1转换大型XML为UTF-8与外部DTD实体

来自分类Dev

将(txt | srt)文档从Western(ISO-8859-15)转换为UTF-8

来自分类Dev

从 Linux 终端将 ISO-8859-7 转换为 utf-8 而无需 bom

来自分类Dev

如何将 iso8859_6 中的文件名转换为 utf-8?

来自分类Dev

如何将ISO-8859-1字符正确替换为UTF-8?

来自分类Dev

从 UTF8 转换为 ISO-8859-1 不起作用

来自分类Dev

从UTF-8转换为ISO-8859-15时,哪些双引号字符会自动替换?

来自分类Dev

如何从C中的八进制ISO-8859-1转储utf8

来自分类Dev

根据.procmailrc文件中的文本将utf8解码为ISO-8859-1邮件

来自分类Dev

ASP:我无法将某些字符从utf-8解码为iso-8859-1

来自分类Dev

ASP:我无法将某些字符从utf-8解码为iso-8859-1

来自分类Dev

字符编码问题-UTF8 / iso-8859-1

来自分类Dev

DB是iso-8859-1,使用utf8_encode字符获取错误的转换

来自分类Dev

从ISO-8859-2转换为ORACLE字符集AL16UTF16

Related 相关文章

  1. 1

    将iso-8859-1转换为utf-8 javascript

  2. 2

    Javascript将字符串从utf-8转换为iso-8859-1

  3. 3

    将SQL Server中的文本值从UTF8转换为ISO 8859-1

  4. 4

    从UTF8转换为ISO 8859-5,改为获取ISO 8859-1

  5. 5

    如何在Ruby 2.0中将UTF-8转换为ISO-8859-1?

  6. 6

    将字符从ISO-8859-1转换为Javascript中的UTF-8编码时,保持字符表示

  7. 7

    Symfony2 + Doctrine:如何将iso8859-1转换为utf-8,反之亦然?

  8. 8

    Ruby将字符串编码从ISO-8859-1转换为UTF-8无效

  9. 9

    jQuery或Javascript:从ISO-8859-1转换为utf8

  10. 10

    在Delphi中将UTF8转换为ANSI(ISO-8859-1)

  11. 11

    将UTF-8转换为ISO-8859-2(抛光)

  12. 12

    从UTF-8转换为ISO8859-1并重新转换为UTF-8后,符号会丢失

  13. 13

    从utf8转换为iso-8859-1后未显示丹麦语字符

  14. 14

    使用Dart语言将字符串从ISO-8859-2转换为UTF-8

  15. 15

    使用Dart语言将字符串从ISO-8859-2转换为UTF-8

  16. 16

    从ISO-8859-1转换大型XML为UTF-8与外部DTD实体

  17. 17

    将(txt | srt)文档从Western(ISO-8859-15)转换为UTF-8

  18. 18

    从 Linux 终端将 ISO-8859-7 转换为 utf-8 而无需 bom

  19. 19

    如何将 iso8859_6 中的文件名转换为 utf-8?

  20. 20

    如何将ISO-8859-1字符正确替换为UTF-8?

  21. 21

    从 UTF8 转换为 ISO-8859-1 不起作用

  22. 22

    从UTF-8转换为ISO-8859-15时,哪些双引号字符会自动替换?

  23. 23

    如何从C中的八进制ISO-8859-1转储utf8

  24. 24

    根据.procmailrc文件中的文本将utf8解码为ISO-8859-1邮件

  25. 25

    ASP:我无法将某些字符从utf-8解码为iso-8859-1

  26. 26

    ASP:我无法将某些字符从utf-8解码为iso-8859-1

  27. 27

    字符编码问题-UTF8 / iso-8859-1

  28. 28

    DB是iso-8859-1,使用utf8_encode字符获取错误的转换

  29. 29

    从ISO-8859-2转换为ORACLE字符集AL16UTF16

热门标签

归档