熊猫在多个文件上合并并保存在同一文件中

debugcn 发表于 Dev

用户名

我有4个文件，需要与另一个文件合并并保存。到目前为止，这是我尝试过的

ref ='/home/user/Dir/Reference'
ref = pd.read_csv(ref, sep='\t', header=0)
#T_seq = T_seq.reset_index(drop=False)
#data_frames = []
for filename in file_DE:
    name   = os.path.basename(os.path.normpath(filename))
    files  = pd.read_csv(filename, sep='\t', header=0)
for eachfile in files:
    files_merged  = pd.merge(eachfile, ref , left_on='Gene' , right_on= 'Gene')

但是当我打印files_merged时，它只有标题，

Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
Empty DataFrame
Columns: [Gene, baseMean , log2FoldChange , lfcSE , stat , pvalue , padj, Gene_sym, Gene_type]
Index: []
In [67]:

我的意思是一个空的数据帧，来自文件ref的索引'Gene'和所有其他'files'具有匹配行，但是以这种方式，它仅返回一个空的数据帧。

最后，我的目标是一个数据框，其中所有行都填充有值，而不是像我现在这样的标头和空数据框。

任何帮助都非常感谢

谢谢

最大容量

您可以通过以下方式进行操作：

sep = r'\s+'
ref ='/home/user/Dir/Reference'
ref = pd.read_csv(ref, sep=sep, header=0)

for filename in file_DE:
    name = os.path.basename(os.path.normpath(filename))
    df   = pd.read_csv(filename, sep=sep, header=0)
    pd.merge(df, ref, on='Gene').to_csv('merged_' + name, index=False)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。