我有4个文件,需要与另一个文件合并并保存。到目前为止,这是我尝试过的
ref ='/home/user/Dir/Reference'
ref = pd.read_csv(ref, sep='\t', header=0)
#T_seq = T_seq.reset_index(drop=False)
#data_frames = []
for filename in file_DE:
name = os.path.basename(os.path.normpath(filename))
files = pd.read_csv(filename, sep='\t', header=0)
for eachfile in files:
files_merged = pd.merge(eachfile, ref , left_on='Gene' , right_on= 'Gene')
但是当我打印files_merged时,它只有标题,
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
In [67]:
我的意思是一个空的数据帧,来自文件ref的索引'Gene'和所有其他'files'具有匹配行,但是以这种方式,它仅返回一个空的数据帧。
最后,我的目标是一个数据框,其中所有行都填充有值,而不是像我现在这样的标头和空数据框。
任何帮助都非常感谢
谢谢
您可以通过以下方式进行操作:
sep = r'\s+'
ref ='/home/user/Dir/Reference'
ref = pd.read_csv(ref, sep=sep, header=0)
for filename in file_DE:
name = os.path.basename(os.path.normpath(filename))
df = pd.read_csv(filename, sep=sep, header=0)
pd.merge(df, ref, on='Gene').to_csv('merged_' + name, index=False)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句