我希望读取一个以制表符分隔的大熊猫文件。我使用了以下代码:
df = pd.read_csv('path_to_folder/test.bed', sep='\t',header=0,index_col=0)
但是,结果数据框为空,看起来像这样:
Empty DataFrame
Columns: []
Index: [loc.00001 100 150, loc.00002 200 210 ..... ]
我希望产生一个数据帧,其中包含此文件中存在的标头。
TSS TES
Loci
loc.00001 100 150
loc.00002 200 210
为什么我得到一个空的数据框的任何想法都是有用的。谢谢你。
看来您的分隔符不是tab
,而是whitespace
,所以需要sep='\s+'
:
df = pd.read_csv('path_to_folder/test.bed', sep='\s+',header=0,index_col=0)
或使用参数delim_whitespace
:
df = pd.read_csv('path_to_folder/test.bed', delim_whitespace=True, header=0,index_col=0)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句