python实现GATK多线程加速示例

python实现GATK多线程加速示例

目录

GATK 变异分析

下面的来自网络未验证

GATK 变异分析

对于大数据样本可能会比较慢,因此可以按照染色体拆分后进行多线程并行计算。

下面是我写的一个python多线程脚本,仅供参考,拙劣之处敬请指正。

#!/usr/bin/python3 import _thread import os import threading import time muthreads=[] bam_file="a.mkdup.bam" out_file_prefix="flower" chr_list=["CHR01","CHR02","CHR03","CHR04","CHR05","CHR06","CHR07","CHR08","CHR09","CHR10","CHR11","CHR12","CHR13"] for chr in chr_list: threads_comonder_name= "gatk HaplotypeCaller --intervals " + chr +" -R /mnt/j/BSA/02-read-align/Tifrunner2.fasta -I " + bam_file + " -ERC GVCF -O "+ out_file_prefix +"-"+chr+".erc.g.vcf" muthreads.append(threads_comonder_name) exitFlag = 0 class myThread (threading.Thread): def __init__(self, threadID, name, counter, comander): threading.Thread.__init__(self) self.threadID = threadID self.name = name self.counter = counter self.comander = comander def run(self): print ("开始线程:" + self.name) print_time(self.name, self.counter, 5, self.comander) print ("退出线程:" + self.name) def print_time(threadName, delay, counter,comander): # while counter: if exitFlag: threadName.exit() time.sleep(delay) print(comander) os.system(comander)#调用操作系统命令行处理数据 # counter -= 1 # 创建新线程 threadlist=[] for i, threadsnu in enumerate(muthreads[0:11]): print(i) print(threadsnu) threadsnew=myThread(1, "Thread-" + str(i), 2, threadsnu) threadlist.append(threadsnew) # 开启新线程 for threads in threadlist: threads.start() for threads in threadlist: threads.join() print ("运行结束退出主线程") 下面的来自网络未验证

多条染色体的同样本的vcf文件合并

# for i in {1..22} X Y ;do echo "-I final_chr$i.vcf" '\';done # for i in {10..19} {1..9} M X Y ;do echo "-I final_chr$i.vcf" '\';done module load java/1.8.0_91 GATK=/home/jianmingzeng/biosoft/GATK/gatk-4.0.3.0/gatk $GATK GatherVcfs \ -I final_chr1.vcf \ -I final_chr2.vcf \ -I final_chr3.vcf \ -I final_chr4.vcf \ -I final_chr5.vcf \ -I final_chr6.vcf \ -I final_chr7.vcf \ -I final_chr8.vcf \ -I final_chr9.vcf \ -I final_chr10.vcf \ -I final_chr11.vcf \ -I final_chr12.vcf \ -I final_chr13.vcf \ -I final_chr14.vcf \ -I final_chr15.vcf \ -I final_chr16.vcf \ -I final_chr17.vcf \ -I final_chr18.vcf \ -I final_chr19.vcf \ -I final_chr20.vcf \ -I final_chr21.vcf \ -I final_chr22.vcf \ -I final_chrX.vcf \ -I final_chrY.vcf \ -O merge.vcf

合并的时候需要注意,vcf文件的顺序跟每个vcf文件里面头文件顺序是相同的。

以上就是python实现GATK多线程加速示例的详细内容,更多关于python GATK多线程加速的资料请关注易知道(ezd.cc)其它相关文章!

推荐阅读

    IE脚本错误如何做Web脚本错误解决技巧

    IE脚本错误如何做Web脚本错误解决技巧,,这个问题是由于这样的事实,对网页的HTML源代码和客户端脚本不正确的工作,如微软Jscript或Visual Basic脚本

    1394连接是什么1394网络适配器知识

    1394连接是什么1394网络适配器知识,,今天有网友在QQ群中问了这样一个问题:1394连接是什么?。由于笔者对1394连接不清楚,通过百度搜索与谷歌

    无线路由器网络如何自动断开线路

    无线路由器网络如何自动断开线路,,如何解决无线路由器网络自动断线?大家应该知道无线网络是很方便的,但是就是网络方面相对来说没那么稳定,对

    网络设置教程|如何网络设置

    网络设置教程|如何网络设置,,如何网络设置wifi路由器信道的设置步骤如下:1.打开浏览器,输入192.168.1.1,进入路由器的网关页面。2.输入管理员

    陈天乔:盛大网络为移动互联网

    陈天乔:盛大网络为移动互联网,,12月2日,北京时间,简称:盛大发布的2011财年第三季度财务报告,截至9月30日,在随后的电话会议上,盛大网络董事长和陈

    无法打开网络正常网页的解决方案

    无法打开网络正常网页的解决方案,,昨天我在一家电脑公司做了一个奇怪的现象,在网络的开始都是正常的,QQ是正常的,但不久之后,我发现无法打开网

    路由网络共享设置

    路由网络共享设置,,互联网已经与人们的生活息息相关,但是高昂的入网费用却成了不少人的负担(特别对于广大的莘莘学子),某些网络供应商还会限制