使用python读取CSV文件时的编码问题

用户名

尝试使用python读取CSV文件时遇到障碍。

更新:如果您只想跳过字符或错误,可以打开文件,如下所示:

with open(os.path.join(directory, file), 'r', encoding="utf-8", errors="ignore") as data_file:

到目前为止,我已经尝试过了。

for directory, subdirectories, files in os.walk(root_dir):
    for file in files:
        with open(os.path.join(directory, file), 'r') as data_file:
            reader = csv.reader(data_file)
            for row in reader:
                print (row)

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to <undefined>

我试过了

with open(os.path.join(directory, file), 'r', encoding="UTF-8") as data_file:

错误:

UnicodeEncodeError: 'charmap' codec can't encode character '\u2026' in position 223: character maps to <undefined>

现在,如果我只打印data_file,它说它们是cp1252编码的,但是如果我尝试

with open(os.path.join(directory, file), 'r', encoding="cp1252") as data_file:

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to <undefined>

我也尝试了推荐的套餐。

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to <undefined>

我要解析的行是:

2015-11-28 22:23:58,670805374291832832,479174464,"MarkCrawford15","RT @WhatTheFFacts: The tallest man in the world was Robert Pershing Wadlow of Alton, Illinois. He was slighty over 8 feet 11 inches tall.","None

任何想法或帮助表示赞赏。

伊斯兰教

我将使用csvkit,它使用自动检测适当的编码和解码。例如

import csvkit
reader = csvkit.reader(data_file)

正如聊天解决方案中所讨论的那样-

for directory, subdirectories, files in os.walk(root_dir): 
    for file in files: 
        with open(os.path.join(directory, file), 'r', encoding="utf-8") as data_file: 
            reader = csv.reader(data_file) 
            for row in reader: 
                data = [i.encode('ascii', 'ignore').decode('ascii') for i in row] 
                print (data)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Python中读取文件时的编码问题

来自分类Dev

在Python中读取文件时的编码问题

来自分类Dev

使用python读取csv文件时出错

来自分类Dev

在C#中读取CSV文件时出现编码字符串问题

来自分类Dev

使用getline读取.csv文件时遇到问题

来自分类Dev

使用Python打开时对csv文件进行编码

来自分类Dev

读取csv文件时出现问题

来自分类Dev

通过PHP COM读取Excel文件时出现编码问题

来自分类Dev

使用Pandas在python中读取csv文件时出错

来自分类Dev

使用 Python2.7 读取压缩的 csv 文件时出错

来自分类Dev

Python:在使用熊猫读取 CSV 文件时替换值

来自分类Dev

使用python读取CSV文件时打印特定元素

来自分类Dev

当读取为 readAsArrayBuffer 时,Filereader 使用正确的编码读取文件

来自分类Dev

Python3文本编码问题:使用for循环从文本文件中读取时,多余的第一个字符

来自分类Dev

Python:使用UTF-8编码读取德语/西班牙语CSV文件

来自分类Dev

Python:使用UTF-8编码读取德语/西班牙语CSV文件

来自分类Dev

在python中读取文件时出现的问题

来自分类Dev

使用python将中文文本抓取到csv中时的编码问题

来自分类Dev

熊猫:使用UCS-2 LE编码读取csv文件

来自分类Dev

如何使用从CSV文件中读取的é来修复字符编码

来自分类Dev

读取以Western编码(ISO-8859-1)编码的文本文件时出现问题

来自分类Dev

从 JSON 转换为 CSV 时的 Python 3 编码问题

来自分类Dev

使用Bottle上传和处理CSV文件;可能的编码问题

来自分类Dev

从内存读取抓取的csv文件时出现解码问题

来自分类Dev

从CSV文件读取到Postgresql时出现问题

来自分类Dev

读取json文件和编码问题

来自分类Dev

在Github上读取Markdown文件的编码问题

来自分类Dev

Python 文件读取问题

来自分类Dev

使用Python以小写形式读取CSV文件

Related 相关文章

  1. 1

    在Python中读取文件时的编码问题

  2. 2

    在Python中读取文件时的编码问题

  3. 3

    使用python读取csv文件时出错

  4. 4

    在C#中读取CSV文件时出现编码字符串问题

  5. 5

    使用getline读取.csv文件时遇到问题

  6. 6

    使用Python打开时对csv文件进行编码

  7. 7

    读取csv文件时出现问题

  8. 8

    通过PHP COM读取Excel文件时出现编码问题

  9. 9

    使用Pandas在python中读取csv文件时出错

  10. 10

    使用 Python2.7 读取压缩的 csv 文件时出错

  11. 11

    Python:在使用熊猫读取 CSV 文件时替换值

  12. 12

    使用python读取CSV文件时打印特定元素

  13. 13

    当读取为 readAsArrayBuffer 时,Filereader 使用正确的编码读取文件

  14. 14

    Python3文本编码问题:使用for循环从文本文件中读取时,多余的第一个字符

  15. 15

    Python:使用UTF-8编码读取德语/西班牙语CSV文件

  16. 16

    Python:使用UTF-8编码读取德语/西班牙语CSV文件

  17. 17

    在python中读取文件时出现的问题

  18. 18

    使用python将中文文本抓取到csv中时的编码问题

  19. 19

    熊猫:使用UCS-2 LE编码读取csv文件

  20. 20

    如何使用从CSV文件中读取的é来修复字符编码

  21. 21

    读取以Western编码(ISO-8859-1)编码的文本文件时出现问题

  22. 22

    从 JSON 转换为 CSV 时的 Python 3 编码问题

  23. 23

    使用Bottle上传和处理CSV文件;可能的编码问题

  24. 24

    从内存读取抓取的csv文件时出现解码问题

  25. 25

    从CSV文件读取到Postgresql时出现问题

  26. 26

    读取json文件和编码问题

  27. 27

    在Github上读取Markdown文件的编码问题

  28. 28

    Python 文件读取问题

  29. 29

    使用Python以小写形式读取CSV文件

热门标签

归档