我看过一些关于如何将文件读入数据帧的网站,但找不到教我如何读取使用 soh 拆分数据的文件的网站。
我得到的文件没有扩展名,但它们看起来像 .txt 文件。
现在我逐行读取文件以创建数据帧,这需要很多时间。有没有办法让它更快?
from pandas import DataFrame
openfile = open('filename','r')
column1 = []
column2 = []
for line in openfile:
line = line.strip().split('\x01') #soh equals to '\x01'
column1.append(line[0])
column2.append(line[1])
data = {'column1':column1, 'column2':column2}
table = DataFrame(data,columns = ['column1','column2'])
如果您的数据没有标题,则应该这样做:
import pandas as pd
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2'])
您可以在此处了解有关阅读文件的更多信息。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句