熊猫:使用UCS-2 LE编码读取csv文件

米哈尔

我想使用UCS-2 LE编码导入由第三方应用程序生成的10K csv文件。我不想像示例Python UTF-16那样使用csv阅读器,因为文件太多。

在下面,您可以找到我的代码,在这里我仅尝试阅读其中的代码。我正在使用Python 3.4和Pandas 0.18.1

样本文件下载。

MWE:

import pandas as pd

df = pd.read_csv('1.csv', 
             encoding="mbcs",
             skip_blank_lines=True,
             error_bad_lines=False,
             decimal=',',
             sep='\s+')

我收到一个错误:

CParserError:标记数据时出错。C错误:字符串内的EOF从第17行开始

法比奥·拉曼纳(Fabio Lamanna)

实际上,我不知道您的预期输出可能是多少,但是我正在读取具有以下内容的文件:

df = pd.read_csv('1.csv', encoding="utf-16", skip_blank_lines=True, error_bad_lines=False, decimal=',', sep='\s+', skiprows=5)

获得类似的东西:

In [17]: df.head()
Out[17]: 
  Oznaczenie techniczne  Wartość Jednostka                Opis obiektu  \
0  PPHS:LPlt'Ahu'CumEg1    488.0        GJ  Energia skumulowana chłodu   
1  PPHS:LPlt'Ahu'CumVlm  57263.0        m3        Objętość skumulowana   
2      PPHS:LPlt'Ahu'Fl     31.6      m3/h                    Przepływ   
3     PPHS:LPlt'Ahu'Pwr    111.0        kW                         Moc   
4     PPHS:LPlt'Ahu'TFl     12.7        °C       Temperatura zasilania   

  Parameter   Value Timestamp  
0     PrVal  2016-07-27 19:55  
1     PrVal  2016-07-27 19:55  
2     PrVal  2016-07-27 19:55  
3     PrVal  2016-07-27 19:55  
4     PrVal  2016-07-27 19:55  

基本上,我跳过了前5行(与文件的报告有关,实际上使文件的格式混乱了)。希望能有所帮助。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Java-Apache Beam:使用“ UCS2-LE BOM”编码从GCS读取文件

来自分类Dev

R:从 GitHub 读取 UCS-2 LE bom 文件

来自分类Dev

将Powershell创建的文件的编码更改为UTF8而不是UCS-2 LE

来自分类Dev

如何使用从CSV文件中读取的é来修复字符编码

来自分类Dev

使用python读取CSV文件时的编码问题

来自分类Dev

使用熊猫从zip读取特定的csv文件

来自分类Dev

如何使用熊猫从csv文件中的字符串读取2E2、2E4、3E2、3E4?

来自分类Dev

使用熊猫读取2个csv文件,使用一个文件中的值在第二个文件中查找其他值

来自分类Dev

使用熊猫读取2个csv文件,使用一个文件中的值在第二个文件中查找其他值

来自分类Dev

Python:使用UTF-8编码读取德语/西班牙语CSV文件

来自分类Dev

Python:使用UTF-8编码读取德语/西班牙语CSV文件

来自分类Dev

CakePHP将XML视图编码设置为UCS2

来自分类Dev

在 smpp 上以 UCS2(即编码)发送 Flash SMS

来自分类Dev

使用熊猫将csv文件作为字典读取

来自分类Dev

使用熊猫读取Python中的csv文件块

来自分类Dev

无法使用熊猫从特定的.CSV文件中读取内容

来自分类Dev

使用熊猫读取Python中的csv文件块

来自分类Dev

使用关闭列有问题的熊猫读取csv文件

来自分类Dev

Python:在使用熊猫读取 CSV 文件时替换值

来自分类Dev

使用双引号正确读取熊猫中的 CSV 文件

来自分类Dev

使用熊猫读取无界文件

来自分类Dev

使用熊猫读取.data文件

来自分类Dev

使用熊猫合并/合并2个不同的Excel文件/表格

来自分类Dev

读取Excel文件时的熊猫数据框和字符编码

来自分类Dev

读取csv文件熊猫时提供列名

来自分类Dev

用熊猫读取格式错误的“ csv”文件

来自分类Dev

当读取为 readAsArrayBuffer 时,Filereader 使用正确的编码读取文件

来自分类Dev

使用MATLAB读取CSV文件?

来自分类Dev

使用MATLAB读取CSV文件?

Related 相关文章

  1. 1

    Java-Apache Beam:使用“ UCS2-LE BOM”编码从GCS读取文件

  2. 2

    R:从 GitHub 读取 UCS-2 LE bom 文件

  3. 3

    将Powershell创建的文件的编码更改为UTF8而不是UCS-2 LE

  4. 4

    如何使用从CSV文件中读取的é来修复字符编码

  5. 5

    使用python读取CSV文件时的编码问题

  6. 6

    使用熊猫从zip读取特定的csv文件

  7. 7

    如何使用熊猫从csv文件中的字符串读取2E2、2E4、3E2、3E4?

  8. 8

    使用熊猫读取2个csv文件,使用一个文件中的值在第二个文件中查找其他值

  9. 9

    使用熊猫读取2个csv文件,使用一个文件中的值在第二个文件中查找其他值

  10. 10

    Python:使用UTF-8编码读取德语/西班牙语CSV文件

  11. 11

    Python:使用UTF-8编码读取德语/西班牙语CSV文件

  12. 12

    CakePHP将XML视图编码设置为UCS2

  13. 13

    在 smpp 上以 UCS2(即编码)发送 Flash SMS

  14. 14

    使用熊猫将csv文件作为字典读取

  15. 15

    使用熊猫读取Python中的csv文件块

  16. 16

    无法使用熊猫从特定的.CSV文件中读取内容

  17. 17

    使用熊猫读取Python中的csv文件块

  18. 18

    使用关闭列有问题的熊猫读取csv文件

  19. 19

    Python:在使用熊猫读取 CSV 文件时替换值

  20. 20

    使用双引号正确读取熊猫中的 CSV 文件

  21. 21

    使用熊猫读取无界文件

  22. 22

    使用熊猫读取.data文件

  23. 23

    使用熊猫合并/合并2个不同的Excel文件/表格

  24. 24

    读取Excel文件时的熊猫数据框和字符编码

  25. 25

    读取csv文件熊猫时提供列名

  26. 26

    用熊猫读取格式错误的“ csv”文件

  27. 27

    当读取为 readAsArrayBuffer 时,Filereader 使用正确的编码读取文件

  28. 28

    使用MATLAB读取CSV文件?

  29. 29

    使用MATLAB读取CSV文件?

热门标签

归档