我有一个问题。我想将两个文件合并在一起。在哪里:
档案1:
chr**1 10000** rs200132 A C 100.000
chr**2 20000** rs5000 C G 80.000
档案2:
rs200132 **1:10000** A 800 200 Nmf
rs210111 **1:10000** G 200 800 VFC
rs310000 **1:10000** C 100 500 tff
rs50001 **2:20000** T 500 100 jpp
rs60000 **2:20000** A 1000 10 jkl
输出:
chr**1 10000** rs200132 A A C 800 200 Nmf
chr**1 10000** rs210111 G A C 200 800 VFC
chr**1 10000** rs310000 C A C 100 500 tff
chr**2 20000** rs50001 T C G 500 100 jpp
chr**2 20000** rs60000 A C G 1000 10 jkl
然后,从第一个文件开始,在“ chr”之后是标记数字,在第二列中是数字。第二个文件中有相同的标记,但第二列中有类似的标记,例如1:10000。我想加入这两个文件,但是对于第一个文件,将有更多的连接行(例如:对于第一个文件的第一行将是第二个文件的三行。)谢谢
您可以使用此awk
,
awk 'NR==FNR{a[$2]=$1;b[$2]=$4" "$5;next} {sub(/.*:/,"",$2); $3=$1" "$3" "b[$2]; $1=a[$2];}1' file1 file2
测试:
sat:~# awk 'NR==FNR{a[$2]=$1;b[$2]=$4" "$5;next} {sub(/.*:/,"",$2); $3=$1" "$3" "b[$2]; $1=a[$2];}1' file1 file2
chr**1 10000** rs200132 A A C 800 200 Nmf
chr**1 10000** rs210111 G A C 200 800 VFC
chr**1 10000** rs310000 C A C 100 500 tff
chr**2 20000** rs50001 T C G 500 100 jpp
chr**2 20000** rs60000 A C G 1000 10 jkl
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句