我是熊猫和蟒蛇的新手。我有一个我不明白的问题,我有一组.dat文件,因此我将它们收集在一个.csv文件中。
path =r'/Users/Desktop/03/17'
filenames = glob.glob(path + "/*dat")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
data_day = pd.concat(dfs,ignore_index=True)
data_day.head()
data_day.to_csv('/Users/Desktop/11.csv',index=False)
data2 = pd.read_csv('/Users/Desktop/11.csv', sep=' ')
data1 = data2.dropna(axis=1)
data1
这种类型的.dat文件(包含21列)效果很好。21列,但不适用于包含27列的此类文件。27列而不是27列,它使文件变为18列。我怎么了
链接文件中的分隔符不是单个空格,因此pd.read_csv(..., sep=' ')
会失败。尝试pd.read_csv(..., delim_whitespace=True)
使用任意数量的空格作为分隔符。这应该大致等效于pd.read_csv(..., sep='\s+')
,但速度更快。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句