使用 wtdbg2 进行基因组的组装,软件安装这里就不介绍了,流程都一样。可以用conda安装,也可以自己去下载安装包,源码编译安装,安装完记得添加环境变量。

下面介绍一下 wtdbg2 对三代 基因组数据的组装,网上有很多教程,但是都不够完整,之前看了陈连福的教程跑完但是没有用二代和三代数据进行纠错处理。

#用过滤 后的数据进行基因组组(组装之前得先进行质控、过滤和survery分析,以评估数据的碱基质量是否值得组装。这些 后面有时间的话 会给补上)
wtdbg2 -t 30 -p 0 -k 15 -AS 2 -E 1 -s 0.05 -L 5000 -x nanopore -g 800m  -i ssy_filter_reads.fa -fo ssy_filter_reads_1#运行下面这步后就会生成组装后的fasta序列,文件路径自己注意修改wtpoa-cns -t 30 -i ssy_filter_reads_1.ctg.lay.gz -fo ssy_filter_reads.ctg.lay_1.fa

运行上面两个脚本之后基因组组装就完成了,数据量比较大的话 记得挂后台跑。

下面就得用原始三代数据和二代数据对组装好的fasta文件进行纠错处理。这个网上的教程也很多,纠错软件也很多,有用racon + polin 的,也用用 minimap2+bwa的,熟练掌握一个能将流程跑通即可,也可以混合使用。一般迭代两三次进行纠错就好了。

下面介绍用 minimap2 使用 三代数据纠错 和 使用 bwa (适合短序列)使用 二代数据进行抛光处理:

#用三代数据进行纠错: (这步用nohup挂后台跑会报错 使用screen 挂后台跑)
minimap2 -t 16 -ax map-pb -r 2k dbg.raw.fa reads.fa.gz | samtools sort -@4 >dbg.bam     samtools view -F0x900 dbg.bam | wtpoa-cns -t 16 -d dbg.raw.fa -i - -fodbg.cns.fa
#用二代数据进行纠错:
bwa index dbg.cns.fa    bwa mem -t 16 ../dbg.cns.fa  sr.1.fa sr.2.fa | samtools sort -O SAM | wtpoa-cns -t 16 -x sam-sr -d ../dbg.cns.fa -i - -fo dbg.srp.fa

下面附带介绍一下 screen 的使用方法:

使用 screen 可以在后台运行 进程
screen -S zsx   创建一个新窗口
screen -ls  查看所有窗口
screen -r [name]  进入某个窗口
screen -d [name] 退出某个窗口
screen -S [name] -X quit   删除某个窗口
也可以  kill -9 窗口进程号删除  ,之后 需要运行  screen -wipe 清除 死去的窗口
快捷会话分离  回到主窗口   Ctrl+A  然后 D

使用 wtdbg2进行基因组组装,并使用 minimap2 和 bwa 进行纠错处理相关推荐

  1. NBT:牛瘤胃微生物组的4941个宏基因组组装基因组(MAG)

    牛瘤胃微生物组的参考基因组集 用于瘤胃微生物组生物学和酶发现的4,941个瘤胃宏基因组组装基因组集 Compendium of 4,941 rumen metagenome-assembled gen ...

  2. Nature方法 | 三代长读长宏基因组组装软件metaFlye

                    简介                  标题:metaFlye:基于重复图的可拓展长序列宏基因组序列组装 metaFlye: scalable long-read me ...

  3. 全基因组组装,注释与评估软件

    全基因组组装,注释与评估软件集锦(更新于2020.03.20) 1.Assembly 1.1质体基因组 1.1.1NOVOPlasty program language:Perl Reference: ...

  4. 单倍型基因组组装方法

    1. 什么是单倍型? image 同源染色体:同源染色体,一个来自母本,一个来自于父本. 单倍型:单倍体基因型的简称.遗传学上指在单条染色体上一系列遗传变异位点的组合. 2. 单倍型组装的意义? 目前 ...

  5. MPB:微生物所蔡磊组-​​基于二代测序的真菌基因组组装和注释

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  6. iMeta | 青岛华大范广益组基于共标签测序数据的高质量宏基因组组装工具MetaTrass...

    点击蓝字 关注我们 MetaTrass:基于共标签测序数据的人类肠道微生物高质量宏基因组组装工具 https://doi.org/10.1002/imt2.46 RESEARCH ARTICLE ●2 ...

  7. 基因组组装---Nanopore数据评估(nanoqc和NanoPlot套件工具)

    基因组组装---Nanopore数据评估(拟南芥nanopore) 1. 下载软件 2. 软件使用 (1)nanoQC (2)NanoPlot 1. 下载软件 使用conda创建环境,下载nanoqc ...

  8. HiFi全基因组测序技术与实例|HiFi基因组组装软件推荐

    HIFI技术的简介 HiFi reads(High fidelity reads) 是Sequel II 三代测序平台推出的兼顾长读长和高准确度的测序序列,一般采用CCS(Circular Conse ...

  9. Nature子刊:宏基因组组装基因组实现谱系解析

    宏基因组组装基因组实现谱系解析 MAGs achieve lineage resolution Nature Microbiology [IF: 17.745] DOI:https://doi.org ...

最新文章

  1. CentOS防火墙配置方法-详细解读如何配置CentOS防火墙
  2. Python基础 模块
  3. mysql]ERROR 1364 (HY000): Field 'ssl_cipher' doesn't have a default value
  4. XML引入多scheme文件约束简单示例
  5. mysql 当前排名查询,MySQL排名查询分配
  6. linux ps 命令使用
  7. Cube和Grouping 和Rollup
  8. php黄页,PHP 黄页的url
  9. 飞鸽类能记住传书的人类
  10. canvas笔记-文本水平垂直对齐与度量
  11. 译: 6. 任务调度(定时执行任务)
  12. 计算机应软件与理论学什么,计算机软件与理论
  13. 浅谈OA办公系统与钉钉的区别
  14. win10用账户登录计算机,图文详解让你的win10系统实现微软账户自动登录-系统操作与应用 -亦是美网络...
  15. 万能免费信息采集软件-免费网站信息内容数据采集软件
  16. 谷歌关键字推广操作技巧
  17. 9gag for android,GitHub - Mixiaoxiao/9GAG: 9GAG-Android (unofficial), Android Design.
  18. 长沙python培训_长的解释|长的意思|汉典“长”字的基本解释
  19. 大学生必读的100本书
  20. WebDriverPool浏览器驱动池 减少驱动频繁打开和关闭引起的资源损耗

热门文章

  1. 【有限元分析】客车车身设计
  2. proceeding of the ieee期刊
  3. [硫化铂]高中数列题
  4. 艾利特EC系列机器人使用入门
  5. 如何快速理解模糊PID---(二)
  6. java运行内存计算_java计算金额是放在内存中计算还是在sql中计算好呢?
  7. 基于java的美甲预约微信小程序
  8. 利用Python实现整数序列求和
  9. 2021 年还剩 2 个月,字节跳动的工程师如何在业务与技术中成长?
  10. ES2中关于索引模板的操作