跳过行的Pandas .DAT文件导入错误

乌斯塔纳

我正在尝试将巨大的数据文件分解为较小的部分。我正在使用以下脚本-

 df = pd.read_csv(file_name, header=None,encoding='latin1',sep='\t',nrows=100000, skiprows = 100000)

但我看到“跳过行”参数跳过200000行而不是100000行,有人可以告诉我为什么会这样

乌斯塔纳

感谢@EdChum,我能够使用以下代码使用chunksize解决问题:-

i = 0
tp = pd.read_csv(filename,header=None,encoding='latin1', sep='\t', iterator=True, chunksize=1000000)
for c in tp:
    ca = pd.DataFrame(c)
    ca.to_csv (file_destination +str(i)+'test.csv', index = False, header = False)
    i = i+1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将 Twitter 数据导入 Pandas 时跳过属性错误

来自分类Dev

Powershell导入时会跳过txt文件的前2行

来自分类Dev

.dat文件导入困难

来自分类Dev

如何导入.dat文件?

来自分类Dev

从 .dat 文件导入字典

来自分类Dev

python文件查找跳过行

来自分类Dev

将CSV导入PowerPivot时跳过行

来自分类Dev

使用php导入csv时跳过行

来自分类Dev

将CSV导入PowerPivot时跳过行

来自分类Dev

使用fopen导入数据跳过行

来自分类Dev

PANDAS:从 csv 文件导入数据时列名错误

来自分类Dev

使用导入导出向导将DAT文件内容导入到SQL Server表中-错误

来自分类Dev

需要跳过包含“值错误”的行

来自分类Dev

读取.tsv文件时跳过备用行

来自分类Dev

解析csv文件并跳过前3000行

来自分类Dev

跳过CSV文件的第一行

来自分类Dev

循环浏览文件-跳过长行

来自分类Dev

批处理文件FOR命令跳过行

来自分类Dev

读取.tsv文件时跳过备用行

来自分类Dev

Laravel中如何使用文件跳过行

来自分类Dev

读取文件作为命令跳过行的输入

来自分类Dev

将CSV文件导入postgres-跳过第一行

来自分类Dev

使用FREAD将CSV文件导入R时,跳过以特定值开头的行

来自分类Dev

将CSV文件导入postgres-跳过第一行

来自分类Dev

如何从随便的.dat文件创建Pandas df?

来自分类Dev

导入XML和跳过错误(PHP)

来自分类Dev

导入XML和跳过错误(PHP)

来自分类Dev

Excel:导入CSV时如何跳过特定的行

来自分类Dev

跳过文件的前x行和后y行