将文件读入 Pandas 数据帧(使用 soh 拆分数据)

李汤姆

问题:

我看过一些关于如何将文件读入数据帧的网站,但找不到教我如何读取使用 soh 拆分数据的文件的网站。

我得到的文件没有扩展名,但它们看起来像 .txt 文件。

现在我逐行读取文件以创建数据帧,这需要很多时间。有没有办法让它更快?

代码:

from pandas import DataFrame 
openfile = open('filename','r')
column1 = []
column2 = []
for line in openfile:
    line = line.strip().split('\x01') #soh equals to '\x01'
    column1.append(line[0])
    column2.append(line[1])
data = {'column1':column1, 'column2':column2}
table = DataFrame(data,columns = ['column1','column2'])
齐帕

如果您的数据没有标题,则应该这样做:

import pandas as pd
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2'])

您可以在此处了解有关阅读文件的更多信息

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何将 SEC txt 文件读入 Pandas 数据帧?

来自分类Dev

python pandas:根据列值拆分数据帧

来自分类Dev

处理拆分数据帧时出现 Pandas KeyError

来自分类Dev

使用Python和Pandas在文本文件中拆分数据

来自分类Dev

如何在pyspark中使用pandas_udf拆分数据帧中的字符串

来自分类Dev

将上传的 csv 文件读入 Pandas 数据帧

来自分类Dev

将使用 Feather 存储的 Pandas 数据帧读入 R

来自分类Dev

将数据从XML文件读入SWF文件

来自分类Dev

拆分数据帧 (csv)

来自分类Dev

动态拆分数据帧

来自分类Dev

Pandas DataFrame 输出为 ASCII ^A 或 Unicode SOH 分隔文件

来自分类Dev

根据列拆分数据帧,并用特定名称写出多个拆分的.txt文件

来自分类Dev

使用pySpark将hdfs的零件文件读入数据帧

来自分类Dev

Pandas:拆分数据帧行并重新排列列值

来自分类Dev

Python将txt文件读入数据框

来自分类Dev

将数据从txt文件读入向量

来自分类Dev

无法将数据从文件读入结构

来自分类Dev

将主数据帧拆分为循环中的多个数据帧-Pandas

来自分类Dev

串口拆分数据

来自分类Dev

使用Pandas将数据帧作为JSON编码字典写入文本文件

来自分类Dev

使用 Pandas DataFrame 将字典打印到文件,但更改数据帧格式

来自分类Dev

通过分组拆分数据帧,并使用Pander和Rapport将特定于组的行打印到单个HTML文件中

来自分类Dev

按重复列拆分数据帧

来自分类Dev

在Apache Spark中拆分数据帧

来自分类Dev

按条件间隔拆分数据帧

来自分类Dev

拆分数据帧 Spark Scala

来自分类Dev

在 PrefixSpan 之后拆分数据帧

来自分类Dev

根据每组的大小拆分数据帧

来自分类Dev

使用熊猫read_csv()将文件的2行读入具有两列的数据帧中

Related 相关文章

热门标签

归档