WDL是编写工作流的语法,需要cromwell执行引擎执行,GATK的管道脚本以某种形式的并行化以加快执行速度


1 WDL(工作流程描述语言)

    该工作流描述语言(WDL)是指定数据处理与人类可读且可写的工作流的语法的方式。WDL使定义复杂的分析任务,在工作流中将它们链接在一起并使其执行并行化变得很简单。该语言使常见的模式易于表达,同时也允许不常见或复杂的行为。并努力实现不仅在执行平台之间,而且在不同类型的用户之间的可移植性。无论是分析师,程序员,生产系统的操作员还是任何其他类型的用户,WDL都应易于访问和理解。

1.1 执行引擎

    WDL本身不是可执行文件,而是需要执行引擎才能运行。兼容的执行引擎应支持WDL规范的特定版本的功能。请参阅相应的引擎文档,以获取有关可用执行选项和支持的信息。

  • Cromwell
  • Miniwdl

1.2 解析器和语言支持

  • 基本解析器及其语法定义(基于hermes)可以在parsers/每个版本的目录中找到。当前支持Java,Python和javascript。我们认为这些解析器可以正常工作,但是尚未验证这些声明。
  • MiniWDL - MiniWDL为WDL和命令行验证提供python绑定。它重量轻且易于使用。
  • wdl4s - WDL的Scala绑定。它已被折叠到更广泛的cromwell代码库中
  • WOMTool - 用于解析,验证,整理和生成WDL图形的独立工具。
  • wdl-aid - 基于WDL文件中定义的parameter_meta信息,为WDL工作流的输入生成文档。

2 Cromwell

    WDL本身不是可执行文件,而是需要执行引擎才能运行。

    Cromwell就是一个执行引擎


3 GATK4 (基因组分析工具箱)

    GATK,发音为 “Gee Ay Tee Kay” (not “Gat-Kay”),代表GenomeAnalysisToolkit。它是用于分析高通量测序数据的命令行工具的集合,主要侧重于变体发现。这些工具可以单独使用,也可以链接成完整的工作流程。我们提供了针对特定用例量身定制的端到端工作流程,称为GATK最佳做法。

    从4.0版开始,GATK包含Picard工具包的副本,因此所有Picard工具都可从GATK本身获得。

入门指引:GATK4入门

3.1 GATK4的运行管道(pipeline):

    处理序列数据和执行变体发现所涉及的大多数工作都可以以管道脚本的形式自动化,该脚本通常包括某种形式的并行化以加快执行速度。我们提供GATK最佳做法工作流程的脚本化实现,以及一些其他帮助程序/附件脚本,以使每个人都可以更轻松地运行这些有时相当复杂的工作流程。

    这些工作流是用 WDL(工作流程描述语言)编写的,旨在在支持WDL执行的任何平台上运行。选项在《用户指南》的“流水线”部分中列出。我们首选的选择是Cromwell执行引擎,它与GATK一样,也是由Broad的数据科学平台(DSP)开发的,可以在我们的云平台Terra(以前称为FireCloud)上作为服务使用。

    如果您选择通过Terra运行GATK工作流程,则实际上不需要执行任何上述操作,因为所有内容都已经以即用形式预加载了(软件,脚本,甚至一些示例数据)。此时,Terra是完全像我们自己的工作一样运行工作流的最简单方法。如上所述,我们已经在名为Terra的云平台上的预配置工作区中设置了所有最佳实践管道,因此您无需进行任何设置即可试用它们。您可以将结果与其他管道进行比较,还可以(私密且安全地)上传自己的数据以测试我们的管道在此方面的性能。

WDL、Cromwell、GATK4的关系相关推荐

  1. 生信工作流框架搭建 | 01-nextflow、snakemake、wdl 对比测试

    本篇为biodoge<生信工作流框架搭建>系列笔记的第2篇,该系列将持续更新. 前情提要 上回说到五大流派华山论剑.各显神通,指标衡量下,方才有三大主流框架脱颖而出: 基于groovy的n ...

  2. Cromwell +WDL学习

    WDL (一个workflow description language)+ Cromwell(an execution engine that can run WDL scripts)是目前可以更好 ...

  3. GATK Cromwell +WDL学习

    WDL (一个workflow description language)+ Cromwell(an execution engine that can run WDL scripts)是目前可以更好 ...

  4. GATK官方推荐的workflow语言-WDL

    欢迎关注"生信修炼手册"! 在GATK4的best practice中,不再像以前那样给出每个步骤对应的代码,而是直接给出了官方使用的pipeline.这些pipeline采用WD ...

  5. WDL脚本实战(一)-工作流、程序体、语法检查、输入输出及运行

    WDL是由Broad Institute开发的一种生物信息流程开发语言,与传统的shell流程相比,具有复用性好.支持多种集群架构.便于多任务并行等优势,初次接触,写了个简易流程试水. 1.WDL参考 ...

  6. WDL - 添加管道

    所谓管道,我们指的是把任务链接在一起,形成复杂的管道. 1 简单连接 此时,您知道如何在工作流脚本中包含多个任务.如果您在有关变量的部分中注意,您甚至知道如何将一个任务的输出连接到下一个任务的输入.使 ...

  7. GATK --- wdl 语言

    GATK的pipeline使用WDL进行编写 WDL是一种流程管理语言,内置的支持并行,适合编写pipeline 运行wdl脚本需要两步:第一步编辑参数列表对应的json文件,第二步直接运行Cromw ...

  8. 万字长文梳理CTR预估模型发展过程与关系图谱

    " 本文主要是对CTR预估中的常见模型进行梳理与总结,并分成模块进行概述.每个模型都会从「模型结构」.「优势」.「不足」三个方面进行探讨,在最后对所有模型之间的关系进行比较与总结" ...

  9. 【推荐算法】ctr预估模型总结(LR、FM、FFM、NFM、AFM、WDL、DCN、DeepFM、FwFM、FLEN)

    文章目录 前言 LR POLY2 FM(Factorization Machine) FFM(Field-aware Factorization Machine) AFM(Attention Fact ...

最新文章

  1. nginx的list数据结构
  2. android 记一次富文本加载之路
  3. 视频直播点播nginx-rtmp开发手册中文版
  4. CCNA-数据包在网络设备直接的通信流程
  5. 信息学奥赛一本通(2023:【例4.8】数据统计)
  6. MVC和WebApi中设置Area中的页为首页
  7. [Java] 蓝桥杯ALGO-39 算法训练 数组排序去重
  8. Webrtc中stun和turn的理解
  9. [USACO12NOV]同时平衡线Concurrently Balanced Strings DP map 思维
  10. latex加下划线_Latex学习系列之粗体、斜体和下划线
  11. dvi线支持多少分辨率_DVI接口最大支持的分辨率是多少?VGA呢?
  12. 京东秋招java面试_最新秋招,京东技术中台Java开发面经,有想去面试的可以来看下...
  13. Process-wide API spying - an ultimate hack 摘要翻译(二)
  14. 清明 祭拜于形,感恩于心
  15. 苹果mac启动台变成问号_如何删除MacOs启动台(应用)残留的图标
  16. linux设置网卡开机自启,centos系统怎么设置网卡开机自启
  17. drawio,程序员最好用的在线画图软件!!!
  18. SIO_KEEPALIVE_VALS 用户异常掉线检测
  19. python 画任意多边形
  20. OCR读取身份证地址字符串切割成省、市、区

热门文章

  1. Django框架学习——10—(QuerySet源码、QuerySet的方法、将QuerySet转换为SQL去执行、ORM模型练习)
  2. Win11+Ubuntu22双系统删除Ubuntu分区后出现grub rescue无法启动Win11系统
  3. python扩展库numpy中函数meshgrid()的使用[当你想要两个for循环嵌套处理时,就该想到它]
  4. 前端如何实现权限管理板块的流程和思想
  5. Blender烘焙等距柱状纹理
  6. 2021-10-29 记录一次ubuntu重启后,无法进入图形化界面的解决方法
  7. 机器人运动学与动力学在控制上的区别与联系?
  8. jmplayer苹果app怎么用_GoodPlayerapp_GoodPlayer苹果版下载安装-第一电竞网
  9. 4月22日第六次会议
  10. windows查看服务器启动日志文件,windows服务器日志查看工具