这个问题部分地解决了:

仍存在的"Error"可能与原核特殊的密码子使用、基因组存在gap区、snpEff的进一步参数选择有关。

那么我们完成了什么?假设你分离到了一株菌,是一种当前研究地少、或新发现的物种,NCBI也无参考基因组,那么:

① 需要从头组装

② 二代测序Reads太短,为了获得最大的contig或染色体,就可能需要加些三代测序数据;

③ 组装好了之后就要注释,获得能看得懂的基因名称(Symbol),并很清楚地了解其功能、掌握其序列

④ 这株菌肯定有其特殊之处 (特殊性状),不然你关注不到它,也就是说,同一个物种,你很可能有另一些菌株看起来非常普通,那么你就有了一个"A set of strains"。经过基因组的比较之后,就发现了目标菌株的一些特殊序列 (例如:短的SNP/InDel,或长片段结构变异,无非就是这些),那么你就需要知道这些"变异"的影响效应,比如:是否为错义突变、是否移码、是否为"高影响",这时就需要用到snpEff等类似的程序 (ANNOVAR大概率只能搞人的。因为我们根本不关心欧洲细菌的"人群"变异频率,细菌里还没有这个概念),那么就需要用到基因组注释文件,如gff。

这样的研究(组装+遗传分析)具有很强的扩展性,因为从头测序重测序分析都做了。细菌基因组很小,做这些工作至少从算力上看不在话下。

一个可以实现的有意思的目标:我发现了一株新的、特殊的细菌,组装并注释了它,并发现其在xxx基因中存在的一段特殊序列,或一些SNP/InDel,具备了一种特殊的性状 (降解塑料、固氮、耐药、或致病),可能具有重要的研究价值。

当然也可以做一些进化、溯源、代谢、毒力等分析,甚至用自己的名字给它命名,毕竟你把这个菌的所有序列都展示并注释了。

https://doi.org/10.1016/j.tube.2020.102015

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...相关推荐

  1. 【生信】第一二三代测序技术原理的理解

    [生信]第一二三代测序技术原理的理解 本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用. 目录 [生信]第一二三代测序技术原理的理解 1.了解什么是DNA测序,什么是RNA测序 ...

  2. 宏基因组数据二+三代混合组装并计算Read对Contig的深度

    二+三代混合组装:OPERA-MS 对于我这一批样品,分别使用了Illumina NovaSeq PE250.插入文库约400bp的双端测序,另外对于每一组平行样进行了Oxford Nanopore的 ...

  3. 基于三代测序技术的微生物组学研究进展

    基于三代测序技术的微生物组学研究进展 2020-09-04 09:16 微生物通常指一切难以用肉眼观察到的微小生物, 包括细菌.病毒.古菌.真菌以及一些微小的原生生物.微生物体积微小.结构简单, 却又 ...

  4. 生物信息学——基础篇:一至三代测序技术

    生物信息学 生物信息学--基础篇:一至三代测序技术 文章目录 生物信息学 一.一代测序 二.二代测序 三.三代测序 四.总结 一.一代测序 概述:一代测序(又称Sanger测序). 原理:Sanger ...

  5. 三代测序数据纠错的方法、装置和计算机可读存储介质与流程

    三代测序数据纠错的方法.装置和计算机可读存储介质与流程 文档序号:15616049发布日期:2018-10-09 21:24 导航: X技术> 最新专利>计算;推算;计数设备的制造及其应用 ...

  6. 一代二代三代测序的基本原理及区别是啥啊?

    illumina和pacbio的基本原理就是改造碱基,每个碱基加上不同颜色的发光基团. 测序的时候边合成边测序.和你的测序链ATGC配对完以后,配对合成好的碱基就把发光基团丢出去了,然后这个孔就会发出 ...

  7. 大数据时代千帆竞发,三代测序激流勇进

    大数据时代千帆竞发,三代测序激流勇进 2021-08-20 11:09 21世纪是生物的世纪,也是基因科技蓬勃发展和被广泛应用的世纪,每一代基因测序技术,无一例外地伴随着核心工具的变革和新应用场景的产 ...

  8. 三代测序数据超快组装软件--大牛Li heng 力作

    三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼   分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...

  9. 使用Canu对三代测序进行基因组组装

    Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果. Canu分为三个步骤,纠错,修整和组装,每一步都差不多是如下几个步骤: 加载read到r ...

最新文章

  1. Ubuntu下git使用教程
  2. 【前端Talkking】CSS系列-css3之box-shadow介绍
  3. 河南智游科技 超市管理系统
  4. Python 获取当前文件夹所有文件名并写入到excel文件中
  5. 如何处理VirtualBox启动错误消息:The vboxdrv kernel module is not loaded
  6. 使用ADO.NET的参数集合来有效防止SQL注入漏洞
  7. eclipse开发jsf_在Eclipse上创建JSF / CDI Maven项目
  8. 实时掌握库存动态,看贵州零售业巨头如何用数据优化库存管理!
  9. BootstrapTable分页(一)
  10. Go实现Raft第三篇:命令和日志复制
  11. Centos开放查看端口 防火墙关闭打开
  12. Linux 命令(74)—— top 命令
  13. VB API教程 王国荣
  14. C# 0xC0000005 捕获
  15. 一人身兼多个项目时的“课程表”工作模式实践
  16. Swift -《从0到1 - 5》:封装网络请求工具类(Alamofire + Moya + SwiftyJSON)和链式封装
  17. 李德毅院士:大数据认知
  18. 20191127上海出差总结
  19. Pytorch + Win10系统 + pip安装+ CUDA9.1版本(安装CUDA10.2版本)
  20. 论文笔记:Editing-Based SQL Query Generation for Cross-Domain Context-Dependent Questions

热门文章

  1. 动态规划求编辑距离 - 残阳似血的博客
  2. Windows环境下使用Docker安装MySQL
  3. Ubuntu1604桌面没有图标
  4. centos gdb调试_Linux基础 30分钟GDB调试快速突破
  5. 程序员春节拒带电脑回家办公被开除:法官提醒用人单位应多些宽容和善意!
  6. go依赖包出现版本不兼容的问题
  7. macbook搭建java环境_MacBook从零开始搭建java环境
  8. 近万字Vue详细基础教程
  9. Java写Excel时OOM_JAVA解析Excel工具避免OOM
  10. python 中 map函数的用法(超详细)