前言

本文介绍了两种体细胞变异检测pipeline:

  • TNscope:使用Sentieon特有的算法,拥有更快的计算速度和更高的计算精度,对临床基因诊断样本尤其适用;
  • TNhaplotyper2:匹配Mutect2(现在匹配到4.1.9)结果的同时,计算速度提升10倍以上。

关于TNscope和TNhaplotyper2的完整脚本,可访问:https://github.com/Sentieon/sentieon-scripts/tree/master/example_pipelines/somatic
Sentieon软件下载地址:https://www.insvast.com/sentieon

以下流程主要针对ctDNA和其他高深度测序的样本数据(2000-5000x depth, AF > 0.3%)

第一步:Alignment

# ******************************************
# 1a. Mapping reads with BWA-MEM, sorting for tumor sample
# ******************************************
( sentieon bwa mem -M -R "@RG\tID:$tumor\tSM:$tumor\tPL:$platform" \-t $nt -K 10000000 $fasta $tumor_fastq_1 $tumor_fastq_2 || \echo -n 'error' ) | \sentieon util sort -o tumor_sorted.bam -t $nt --sam2bam -i -
# ******************************************
# 1b. Mapping reads with BWA-MEM, sorting for normal sample
# ******************************************
( sentieon bwa mem -M -R "@RG\tID:$normal\tSM:$normal\tPL:$platform" \-t $nt -K 10000000 $fasta $normal_fastq_1 $normal_fastq_2 || \echo -n 'error' ) | \sentieon util sort -o normal_sorted.bam -t $nt --sam2bam -i -

第二步:PCR Duplicate Removal (Skip For Amplicon)

# ******************************************
# 2a. Remove duplicate reads for tumor sample.
# ******************************************
sentieon driver -t $nt -i tumor_sorted.bam \--algo LocusCollector \--fun score_info \ tumor_score.txt
sentieon driver -t $nt -i tumor_sorted.bam \--algo Dedup \--score_info tumor_score.txt \--metrics tumor_dedup_metrics.txt \ tumor_deduped.bam
# ******************************************
# 2b. Remove duplicate reads for normal sample.
# ******************************************
sentieon driver -t $nt -i normal_sorted.bam \--algo LocusCollector \--fun score_info \ normal_score.txt
sentieon driver -t $nt -i normal_sorted.bam \--algo Dedup \--score_info normal_score.txt \--metrics normal_dedup_metrics.txt \ normal_deduped.bam

第三步: Base Quality Score Recalibration (Skip For Small Panel)

# ******************************************
# 3a. Base recalibration for tumor sample
# ******************************************
sentieon driver -r $fasta -t $nt -i tumor_deduped.bam \--algo QualCal \-k $dbsnp \-k $known_Mills_indels \-k $known_1000G_indels \tumor_recal_data.table
# ******************************************
# 3b. Base recalibration for normal sample
# ******************************************
sentieon driver -r $fasta -t $nt -i normal_deduped.bam \--algo QualCal \-k $dbsnp \-k $known_Mills_indels \-k $known_1000G_indels \ normal_recal_data.table

第四步:Variant Calling

sentieon driver -r $fasta -t $nt -i tumor_deduped.bam -i normal_deduped.bam \
--algo TNscope \
--tumor_sample $TUMOR_SM \
--normal_sample $NORMAL_SM \
--dbsnp $dbsnp \
--disable_detector sv \
--trim_soft_clip \
--min_tumor_allele_frac 0.001 \
--filter_t_alt_frac 0.003 \
--clip_by_minbq 1 \
--min_init_tumor_lod 1.0 \
--min_tumor_lod 4.0 \
--max_fisher_pv_active 0.05 \
--max_normal_alt_frac 0.005 \
--max_normal_alt_qsum 200 \
--max_normal_alt_cnt 5 \
--assemble_mode 4 \
output_tnscope.pre_filter.vcf.gz

第五步:Variant Filtration

bcftools annotate -x "FILTER/triallelic_site" output_tnscope.pre_filter.vcf.gz | \ bcftools filter -m + -s "insignificant" -e "(PV>0.25 && PV2>0.25)" | \ bcftools filter -m + -s "insignificant" -e "(INFO/STR == 1 && PV>0.05)" | \ bcftools filter -m + -s "orientation_bias" -e "FMT/FOXOG[0] == 1" | \  bcftools filter -m + -s "strand_bias" -e "SOR > 3" | \ bcftools filter -m + -s "low_qual" -e "QUAL < 10" | \ bcftools filter -m + -s "short_tandem_repeat" -e "RPA[0]>=10" | \ bcftools filter -m + -s "noisy_region" -e "ECNT>5" | \ bcftools filter -m + -s "read_pos_bias" -e "FMT/ReadPosRankSumPS[0] < -8" | \ sentieon util vcfconvert - output_tnscope.filtered.vcf.gz

【GATK加速】替换BWA/GATK/Mutect2,Sentieon软件 肿瘤体细胞突变检测分析指南-系列2(ctDNA及其他高深度测序样本)相关推荐

  1. Sentieon软件UMI单分子标记处理模块发布,大幅提升准确度和速度

    单分子标签技术(Unique Molecular Identifier, UMI)被广泛应用在极高灵敏度的NGS检测中,尤其是目前炙手可热的循环肿瘤DNA (ctDNA) 检测.ctDNA作为一种非侵 ...

  2. 【NGS分析工具】Sentieon软件常见问题列表(持续更新...)

    Sentieon软件忠于BWA.GATK.MuTect.MuTect2.STAR.Minimap2金标准的数学模型,在保证结果完全匹配GATK/BWA金标准的前提下,分析效率提升10倍以上.Senti ...

  3. Sentieon软件应用之浅层测序分析

    近日,Sentieon与中国遗传疾病诊断领导者安吉康尔积极合作,共同开发测试了基于Sentieon机器学习变异检测模块DNAscope的"浅"测序模型,并探索了该模型在遗传病临床诊 ...

  4. (python)小最的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中

    问题描述 小最的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章 这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义 来替换.对于每个英文单词,软件会先在内存中查 ...

  5. 加速推进新基建,中国联通软件研究院助力广东智造云升级为全国工业平台

    加速推进新基建,中国联通软件研究院助力广东智造云升级为全国工业平台 6月23日,中国联通智造云全国级工业市场顺利完成上线,6月28日,智造云产品成功在湖北省签约下单,打破了省内地域的限制,实现了省分政 ...

  6. 【星云测试】精准测试的软件产品质量效率变化分析

    2019独角兽企业重金招聘Python工程师标准>>> 精准测试的软件产品质量效率变化分析 伴随着软件规模的扩大和软件快速迭代的双重业务加速要求,软件质量控制的压力也越来越明显.但黑 ...

  7. 思迈特软件Smartbi:BI分析工具怎么用

    高效完成基础数据分析 BI分析工具怎么用?在日常的数据分析中,有大量的每隔一段时间就需要进行的数据分析.这类型的数据分析报表整体架构基本一致,只是每个月的具体数据有所不同,只需要替换数据源就能完成. ...

  8. 微软开源软件特征源码分析工具 Application Inspector

    微软近日开源了其内部使用的软件特征源码分析工具 Application Inspector. 现代软件开发实践通常需要基于数百个现有组件中构建应用,无论它们是由组织中的另一个团队.外部供应商还是开源社 ...

  9. 美国“加强软件供应链安全实践的指南” (SSDF V1.1草案) 解读来了

     聚焦源代码安全,网罗国内外最新资讯! 专栏·供应链安全 数字化时代,软件无处不在.软件如同社会中的"虚拟人",已经成为支撑社会正常运转的最基本元素之一,软件的安全性问题也正在成为 ...

最新文章

  1. python反转字符串(简单方法)及简单的文件操作示例
  2. 总结概括对于大数据、高并发的网站如何进行优化的问题
  3. java统计_java统计当前在线数
  4. 工业互联网企业如何做,才能“赋能万物,连接未来”?
  5. linux打包压缩命令有哪些,Linux压缩打包命令使用方法有哪些呢?
  6. 施一公:优秀博士如何养成
  7. maple 2018 窗口关闭提示乱码_iPhone最废柴却无法关闭的俩功能,我终于屏蔽了!...
  8. PSP金手指CMF_r21d修改版安装方法
  9. 抛弃clover,爱上QTTabBar
  10. 20种在学习编程的同时也可以在线赚钱的方法
  11. Unity学习笔记1 锁定摄像机镜头跟随角色移动
  12. 见证成长,PostgreSQL线上沙龙感谢有你
  13. 程序员真的是吃青春饭的吗?
  14. java实现word、pdf文件下载功能
  15. python在mac模拟鼠标点击_如何使用Python在Mac中控制鼠标?
  16. Delphi制作带图标的弹出式选单
  17. spring应用手册-IOC(XML配置实现)-(8)-bean中的scop属性
  18. 夜已深,为何身体没有困意!
  19. Python开发【Django】:组合搜索、JSONP、XSS过滤
  20. 天梯赛-L2-027 名人堂与代金券(25)(多条件排序)

热门文章

  1. 温度是影响计算机,CPU温度过高会造成什么影响_CPU温度过高影响介绍 - 系统家园...
  2. python 多线程
  3. 了解公司企业:Uber
  4. P16[6-4]:PWM驱动舵机(内含:1.接线原理图/实物图+2.代码部分+3.补充知识部分)
  5. html5 全屏样式,HTML5 全屏特征
  6. 【无标题】桥梁防撞预警系统
  7. 大三计算机专业要不要去暑期实习呢?
  8. No documents matching xxx.h could be found
  9. java 简历面试经验总结
  10. 使用Docker转换Oracle数据库.DMP文件格式