哈佛大学医学院Dana-Farber癌症研究所李恒课题组重磅推出三代HiFi宏基因组组装软件——hifiasm-meta。研究论文“Metagenome assembly of high-fidelity long reads with hifiasm-meta”预印本在线发布。

宏基因组样本的do novo组装是研究微生物群落的常用方法。与单个物种的组装相比,宏基因组组装存在PacBio HiFi 数据中读取长度分布的较大差异,以及某些单倍型的高倍性和低覆盖率等难点挑战。本文针对这些难点问题,对hifiasm-meta进行了几项重大更改以应对这些挑战。

hifiasm-meta是基于hifiasm的宏基因组组装工具:

  • 改善了一些宏基因组数据中比单样本测序更突出的问题(例如contained reads);

  • 优先于获得连贯的contigs,过程不需要手工干预,和hifiasm相同是一个binary和一行命令;对于回收variants和SV,可能对read-contig的alignment+variant calling比处理assembly graph更实用);

  • (可选)丢弃冗余reads的模块,不过实际数据通常测序深度没有饱和,尝试丢弃reads的话通常有害且对运行速度没有太大帮助,所以目前只用在深度过高的mock community中。

图1 hifiasm-meta软件组装原理

作者首先在两个模拟菌群ATCC和zymo中评估了hifiasm-meta软件组装效果(表 1)。ATCC由20个不同的物种组成,通过组装对14个高丰富的物种重建为完成图contigs,比metaFlye和Hicanu软件效果更好,未组装到的菌发现其组装gaps都是由于覆盖率不足造成的。

zymo数据集包含17个物种的21个菌株,包括5个大肠杆菌,每个菌株丰度为8%。hifiasm-meta软件都获得了很好的组装效果(表1)。

作者接着测试了三个样本HiFi 宏基因组hifiasm-meta组装,使用CheckM检测完整性和污染度。从sheepA肠道样本中,hifiasm-meta 重建了328个长度>1Mb的contigs(图2a),总长度为656Mb。根据CheckM检测,有173个接近完成图(图2b),其中有125个是环状contigs(图2b),相比于HiCanu(64个)和metaFlye(31个)软件有显著改善。这表明 hifiasm-meta能够完全重建宏样本中更多的物种或菌株。

对比MetaBAT2软件,hifiasm-meta可以找到更多质量的MAGs(图2c)。作者将 hifiasm-meta应用于数据量更大的sheepB 数据集并获得了438 个接近完整的MAGs和245个环状contigs。

图2 经验数据集的宏基因组hifiasm-meta组装结果

对来源于人的杂食和素食者肠道样本进行测试,组装的contigs能够很好的区分杂食样本和素食样本,但是在进化树上MAGs没有明显的聚集倾向:19个属中有至少3个MAGs,其中16个属既有来自杂食者,也有来自素食者的MAGs(图3)。这表明 hifiasm-meta更擅长解决细微的组分差异。

图3 人肠道样本宏基因组hifiasm-meta组装结果

最后,作者比较了软件的性能,hifiasm-meta组装sheepA和鸡数据集需要48个CPU大约18个小时,而人类肠道样本花费了大约3个小时,与metaFlye速度相当,并且始终比HiCanu软件快好几倍。

综上,hifiasm-meta软件将进一步推动宏基因组组装。hifiasm-meta能够在无需人工干预的情况下,从一个深度测序的样本中组装出更多的环状MAGs。这种高质量的宏基因组组装可能会从根本上改变宏基因组分析,并揭示微生物群落的生物学和生物医学意义。

Hifiasm-meta | 你没看错!基于宏基因组的完成图!!相关推荐

  1. 你没看错,浩辰3D软件中CAD图纸与3D模型高效转化这么好用!

    3D模型精度低,无法有效利用? 零件设计很复杂,手忙脚乱.效率低? 各类CAD图纸,都要一笔一画来绘制? 每次设计修改,都仿佛是渡劫修仙, 熬夜加班,咖啡续命? 是时候,改变这一切了! 你没看错,浩辰 ...

  2. 大数据分析苏轼,你没看错,这些都是小学生完成的

    适逢苏轼先生诞辰980周年,清华附小开展了一系列致敬苏轼的活动.同学们利用假期时间共完成课题研究报告23份:<大数据帮你进一步认识苏轼>.<苏轼的朋友圈>.<苏轼的旅游品 ...

  3. 32岁了 学python 来的及吗-32岁的程序员去了国企工作, 晒出年薪, 网友: 我没看错吧...

    原标题:32岁的程序员去了国企工作, 晒出年薪, 网友: 我没看错吧 现如今,相信很多朋友都非常羡慕那些互联网大公司的从业人员,因为他们动不动就年薪三四十万以上,但是这些互联网行业的从业人员也有自己的 ...

  4. android手机怎么拍月亮,用手机拍月亮!对,你没看错

    用手机拍月亮!对,你没看错 2020-01-12 20:54:00 0点赞 3收藏 4评论 12月16日,vivo在桂林发布了全新的X系列影像旗舰手机,vivo X30 Pro .拍照硬件方面,这台手 ...

  5. Nature:基于宏基因组测序构建人类肠道微生物组参考基因集

    文章目录 基于宏基因组测序构建人类肠道微生物组参考基因集 文章影响 作者简介 热心肠日报 摘要 正文 宏基因组测序肠道微生物组 图1. 人类肠道微生物组的覆盖度 人类肠道微生物组的基因集 图2. 预测 ...

  6. Gut Microbes | 基于宏基因组发现猕猴肠道中的大量微生物新基因组

    猕猴肠道宏基因组中新微生物基因组的组装 Assembly of novel microbial genomes from gut metagenomes of rhesus macaque (Maca ...

  7. MPB:广东生态土壤所孙蔚旻组-DNA稳定同位素示踪与宏基因组单菌草图组装联用技术...

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  8. 主存地址位数怎么算_两位数乘一位数也能口算?对!你没看错,不是特殊情况也行...

    什么叫四则运算?加.减.乘.除呗.在四则运算中,如果没有括号,运算规则是先算乘.除,后算加.减. 乘法也是算术中最常见的一种运算.它是将相同的数加起来的一种快捷方式.比如说16×8=128.表示:8个 ...

  9. C语言代码注释必须用/**/ , 你没看错~

    事情是这样的,有人离职,公司调我补缺.那个系统一直有个工程师在维护,参与该系统的新人来了又走,他始终泰然自若.刚过去一个礼拜,我就心下窃吼:"坑爹啊!",也彻底体会到什么叫---绝 ...

最新文章

  1. WCF服务重构实录(上)
  2. OpenCV学习笔记1
  3. Java中关于==和equal的区别 以及equals()方法重写
  4. use metadataApi in apex
  5. 什么是is research?
  6. 算术表达式的实现,支持加减乘除,括号运算,表达式转二叉树
  7. mybatis源码阅读(五) ---执行器Executor
  8. chrome启用flash_如何在Google Chrome中启用Adobe Flash Player
  9. 部署redis主从复制
  10. 机器学习之特征工程-特征选择
  11. java 对象压缩_理解Java对象:要从内存布局及底层机制说起,话说....
  12. 实施工程师的发展前景
  13. 工程项目成本费用明细表_建设工程项目成本明细表模板.xls
  14. bat 等待输入_继续提速——双拼的进阶,音形输入
  15. 乐符识别matlab,基于DPP的自动音符切分识别研究
  16. FS2711代替松翰2711国产单片机
  17. CNN入门讲解:准确率很高就感觉自己萌萌哒?NONONO,还有一点也重要
  18. 多重共线性:python中利用statsmodels计算VIF和相关系数消除共线性
  19. 限流器(一):guava应用级限流器RateLimiter之SmoothBursty
  20. android webView 全屏播放网络视频

热门文章

  1. 邵东职业中专计算机,2012邵东职业中专计算机专业高三四次模拟试卷
  2. 日语助词の的语法汇总附带例句,请牢记
  3. LDR6028 OTG取电传数据方案-直播声卡数据充电转接线方案
  4. 七、springboot 单元测试阶段 (1.JUnit5 的变化 )
  5. SpringBoot实现短信发送
  6. 网赚教程之个人站长域名省钱策略
  7. 三极管的管型及管脚的判别
  8. 2022年3月:逆境修为,顺境修心。
  9. a-upload文件上传
  10. 阿里云推荐码(wzrd94)