从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...
这个问题部分地解决了:
仍存在的"Error"可能与原核特殊的密码子使用、基因组存在gap区、snpEff的进一步参数选择有关。
那么我们完成了什么?假设你分离到了一株菌,是一种当前研究地少、或新发现的物种,NCBI也无参考基因组,那么:
① 需要从头组装;
② 二代测序Reads太短,为了获得最大的contig或染色体,就可能需要加些三代测序数据;
③ 组装好了之后就要注释,获得能看得懂的基因名称(Symbol),并很清楚地了解其功能、掌握其序列;
④ 这株菌肯定有其特殊之处 (特殊性状),不然你关注不到它,也就是说,同一个物种,你很可能有另一些菌株看起来非常普通,那么你就有了一个"A set of strains"。经过基因组的比较之后,就发现了目标菌株的一些特殊序列 (例如:短的SNP/InDel,或长片段结构变异,无非就是这些),那么你就需要知道这些"变异"的影响效应,比如:是否为错义突变、是否移码、是否为"高影响",这时就需要用到snpEff等类似的程序 (ANNOVAR大概率只能搞人的。因为我们根本不关心欧洲细菌的"人群"变异频率,细菌里还没有这个概念),那么就需要用到基因组注释文件,如gff。
这样的研究(组装+遗传分析)具有很强的扩展性,因为从头测序和重测序分析都做了。细菌基因组很小,做这些工作至少从算力上看不在话下。
一个可以实现的有意思的目标是:我发现了一株新的、特殊的细菌,组装并注释了它,并发现其在xxx基因中存在的一段特殊序列,或一些SNP/InDel,具备了一种特殊的性状 (降解塑料、固氮、耐药、或致病),可能具有重要的研究价值。
当然也可以做一些进化、溯源、代谢、毒力等分析,甚至用自己的名字给它命名,毕竟你把这个菌的所有序列都展示并注释了。
https://doi.org/10.1016/j.tube.2020.102015
往期精品(点击图片直达文字对应教程)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
机器学习
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图,注释,并应用于遗传分析...相关推荐
- 【生信】第一二三代测序技术原理的理解
[生信]第一二三代测序技术原理的理解 本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用. 目录 [生信]第一二三代测序技术原理的理解 1.了解什么是DNA测序,什么是RNA测序 ...
- 宏基因组数据二+三代混合组装并计算Read对Contig的深度
二+三代混合组装:OPERA-MS 对于我这一批样品,分别使用了Illumina NovaSeq PE250.插入文库约400bp的双端测序,另外对于每一组平行样进行了Oxford Nanopore的 ...
- 基于三代测序技术的微生物组学研究进展
基于三代测序技术的微生物组学研究进展 2020-09-04 09:16 微生物通常指一切难以用肉眼观察到的微小生物, 包括细菌.病毒.古菌.真菌以及一些微小的原生生物.微生物体积微小.结构简单, 却又 ...
- 生物信息学——基础篇:一至三代测序技术
生物信息学 生物信息学--基础篇:一至三代测序技术 文章目录 生物信息学 一.一代测序 二.二代测序 三.三代测序 四.总结 一.一代测序 概述:一代测序(又称Sanger测序). 原理:Sanger ...
- 三代测序数据纠错的方法、装置和计算机可读存储介质与流程
三代测序数据纠错的方法.装置和计算机可读存储介质与流程 文档序号:15616049发布日期:2018-10-09 21:24 导航: X技术> 最新专利>计算;推算;计数设备的制造及其应用 ...
- 一代二代三代测序的基本原理及区别是啥啊?
illumina和pacbio的基本原理就是改造碱基,每个碱基加上不同颜色的发光基团. 测序的时候边合成边测序.和你的测序链ATGC配对完以后,配对合成好的碱基就把发光基团丢出去了,然后这个孔就会发出 ...
- 大数据时代千帆竞发,三代测序激流勇进
大数据时代千帆竞发,三代测序激流勇进 2021-08-20 11:09 21世纪是生物的世纪,也是基因科技蓬勃发展和被广泛应用的世纪,每一代基因测序技术,无一例外地伴随着核心工具的变革和新应用场景的产 ...
- 三代测序数据超快组装软件--大牛Li heng 力作
三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼ 分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...
- 使用Canu对三代测序进行基因组组装
Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果. Canu分为三个步骤,纠错,修整和组装,每一步都差不多是如下几个步骤: 加载read到r ...
最新文章
- Ubuntu下git使用教程
- 【前端Talkking】CSS系列-css3之box-shadow介绍
- 河南智游科技 超市管理系统
- Python 获取当前文件夹所有文件名并写入到excel文件中
- 如何处理VirtualBox启动错误消息:The vboxdrv kernel module is not loaded
- 使用ADO.NET的参数集合来有效防止SQL注入漏洞
- eclipse开发jsf_在Eclipse上创建JSF / CDI Maven项目
- 实时掌握库存动态,看贵州零售业巨头如何用数据优化库存管理!
- BootstrapTable分页(一)
- Go实现Raft第三篇:命令和日志复制
- Centos开放查看端口 防火墙关闭打开
- Linux 命令(74)—— top 命令
- VB API教程 王国荣
- C# 0xC0000005 捕获
- 一人身兼多个项目时的“课程表”工作模式实践
- Swift -《从0到1 - 5》:封装网络请求工具类(Alamofire + Moya + SwiftyJSON)和链式封装
- 李德毅院士:大数据认知
- 20191127上海出差总结
- Pytorch + Win10系统 + pip安装+ CUDA9.1版本(安装CUDA10.2版本)
- 论文笔记:Editing-Based SQL Query Generation for Cross-Domain Context-Dependent Questions