当前,我具有以下脚本,用于在我创建的可重复环境下的Unix系统上使用HaploTypeCaller程序:
#!/bin/bash
#parallel call SNPs with chromosomes by GATK
for i in 1 2 3 4 5 6 7
do
for o in A B D
do
for u in _part1 _part2
do
(gatk HaplotypeCaller \
-R /storage/ppl/wentao/GATK_R_index/genome.fa \
-I GATK/MarkDuplicates/ApproachBsortedstettler.bam \
-L chr$i$o$u \
-O GATK/HaplotypeCaller/HaploSample.chr$i$o$u.raw.vcf &)
done
done
done
gatk HaplotypeCaller \
-R /storage/ppl/wentao/GATK_R_index/genome.fa \
-I GATK/MarkDuplicates/ApproachBsortedstettler.bam \
-L chrUn \
-O GATK/HaplotypeCaller/HaploSample.chrUn.raw.vcf&
如何将这段代码至少部分更改为并行?我是否应该尝试将整个脚本合并到一个不同的脚本中,在这里您可以在一个不同的问题上看到吗?我会在性能上得到很大的提升吗?
parallel echo HaploSample.chr{1}{2}{3}.raw.vcf ::: 1 2 3 4 5 6 7 ::: A B D ::: _part1 _part2
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句