我想使用UCS-2 LE编码导入由第三方应用程序生成的10K csv文件。我不想像示例Python UTF-16那样使用csv阅读器,因为文件太多。
在下面,您可以找到我的代码,在这里我仅尝试阅读其中的代码。我正在使用Python 3.4和Pandas 0.18.1
样本文件下载。
MWE:
import pandas as pd
df = pd.read_csv('1.csv',
encoding="mbcs",
skip_blank_lines=True,
error_bad_lines=False,
decimal=',',
sep='\s+')
我收到一个错误:
CParserError:标记数据时出错。C错误:字符串内的EOF从第17行开始
实际上,我不知道您的预期输出可能是多少,但是我正在读取具有以下内容的文件:
df = pd.read_csv('1.csv', encoding="utf-16", skip_blank_lines=True, error_bad_lines=False, decimal=',', sep='\s+', skiprows=5)
获得类似的东西:
In [17]: df.head()
Out[17]:
Oznaczenie techniczne Wartość Jednostka Opis obiektu \
0 PPHS:LPlt'Ahu'CumEg1 488.0 GJ Energia skumulowana chłodu
1 PPHS:LPlt'Ahu'CumVlm 57263.0 m3 Objętość skumulowana
2 PPHS:LPlt'Ahu'Fl 31.6 m3/h Przepływ
3 PPHS:LPlt'Ahu'Pwr 111.0 kW Moc
4 PPHS:LPlt'Ahu'TFl 12.7 °C Temperatura zasilania
Parameter Value Timestamp
0 PrVal 2016-07-27 19:55
1 PrVal 2016-07-27 19:55
2 PrVal 2016-07-27 19:55
3 PrVal 2016-07-27 19:55
4 PrVal 2016-07-27 19:55
基本上,我跳过了前5行(与文件的报告有关,实际上使文件的格式混乱了)。希望能有所帮助。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句