Mothur配合qiime生成otutable
qiime设置傻瓜化,安装起来欲仙欲死,操作起来爽翻天。第一次用qiime就发觉这个软件果然酸爽。
公司测序回来发了好几个文件回来,我选择质量控制并拼接好的数据直接上手。
P.S.文件暂缺,后面会补上
质控并拼接好的样品为:trim.2.fq, trim.4.fq, trim.7.fq, trim.11.fq, trim.14.fq, trim.18.fq, trim.19.fq, trim.23.fq, trim.25.fq, trim.28.fq, trim.31.fq, trim.35.fq, trim.37.fq, trim.41.fq, trim.44.fq,合计15个样品。样品如果使用qiime拆分的话,序列如下(以2号样为例):
@2_241533 M02419:322:000000000-BDP8B:1:2119:24295:14257 1:N:0:CAAGAC orig_bc=CTGTA new_bc=CTGTA bc_diffs=0
TACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGTGCGTAGGTGGCTAGGTAAGTCAGATGTGAAAACCCAGGGCTTAACTTTGGGACTGCATTTGAAACTGCTTGGCTAGAGTGCAGGAGAGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACTGTAACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGAAACCCTTGTAGTCC
+
GGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGGGGGGGGGGGGGGGGGGGDGGGGGGGFGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGFGGGGGGGGGGGGGGEGGGGGGGGGGGFGGGGGGGGGGGGGGGGGGGGGGGGGGGGGFE;FGGGGGGGGGGFGGGGGGGGGGGGGFGGGG
...
序列命名必须以@样品名_数字开头。下面开始正式处理:
1. 文件合并
> cat 文件1 文件2 ... > 合并文件
cat trim.2.fq trim.4.fq trim.7.fq trim.11.fq trim.14.fq trim.18.fq trim.19.fq trim.23.fq trim.25.fq trim.28.fq trim.31.fq trim.35.fq trim.37.fq trim.41.fq trim.44.fq > seq.fq
也可以利用通配符一下搞定
cat *.fq > seq.fq
P.S.图形操作界面:选中文件夹中所有文件,右键选择属性,复制所文件名到新文本中,替换“,”。
2.利用Mothur拆分fq文件
mothur > fastq.info(fastq=seq.fq)
3.打开qiime软件
export PATH=~/miniconda2/bin:$PATH #设定conda路径,不知道为啥我这个每次用都要重设一下
source activate qiime1
打开后显示如下
(qiime1) ruminant@ruminant-PowerEdge-T630[qiimeOTU]
4. 看一下序列分布
count_seqs.py -i seq.fasta
结果显示为:
551360 : seq.fasta (Sequence lengths (mean +/- std): 272.8898 +/- 0.5639)
551360 : Total
长度基本分布在273,和我们预期长度一致。P.S.看序列分布和长度还是用Mothur比较爽,后面讲到Mothur再说。
5.OTUpicking
先准备一个配置文件:params.txt,正反向比对都打开,因为测序的可能是负链也可能是正链。文件内容如下:
pick_otus:enable_rev_strand_match True
用官方推荐的open_reference的方法做聚类,默认的reference是greengene13.8(老掉牙了,看到Mothur和Usearch在可劲的喷该数据库),在/usr/share/qiime/data/gg_13_8_otus/rep_set。-r修改参考基因,-m修改聚类方法。15个样的数据量大概需要20分钟,简直是飞快。
pick_open_reference_otus.py -o otus1/ -i seq.fasta -p params.txt -r /usr/share/qiime/data/gg_13_8_otus/rep_set/97_otus.fasta
生成biom格式otu表2个:otu_table_mc2.biom, otu_table_mc2_w_tax.biom,前一个没有注释,后一个有注释
6.转换biom文件
biom格式不是给人看的,简直累死。我们用biom程序转化他为我们熟悉的二维表
cd otus1
biom convert -i otu_table_mc2.biom -o otutable.txt --to-tsv
biom convert -i otu_table_mc2_w_tax.biom -o otutable_tax.txt --to-tsv #注释结果没在表里
biom convert -i otu_table_mc2_w_tax.biom -o otutable_tax.txt --to-tsv --header-key taxonomy #注释结果在表里
代表序列在文件rep_set.fna,树文件在rep_set.tre。
可选步骤. 如果没有注释出来,可以用Mothur注释OTU
mothur> classify.seqs(fasta=rep_set.fna, template=/home/ruminant/Documents/database/tax&seqs/greengene/gg_13_8_99.fasta, taxonomy=/home/ruminant/Documents/database/tax&seqs/greengene/gg_13_8_99.gg.tax)
在此生成了一个rep_set.gg.wang.taxonomy的文件,内容就是OTU和对应的物种。本次有5000多个OTU,我决定用libreoffice calc来处理,还是可视化的界面比较爽。OTU表格中新建一列Taxonomy,Q3中输入=VLOOKUP(A3,[rep_set.gg.wang.taxonomy]rep_set.gg.wang!$A:$B,2,0),填充手柄填充,大功告成。OTU表长这个样子:
Mothur配合qiime生成otutable相关推荐
- Linux下构建自己的C++共享库并配合pkg-config生成链接选项
Linux下构建自己的C++共享库并配合pkg-config生成链接选项 本文将以C++链表的新建.打印操作为例构建自己的共享库,并在实际调试代码时尝试使用.我们在做数据结构题时经常需要将链表打印出来 ...
- Java应用性能分析工具:async-profiler(配合FlameGraph生成火焰图)
前言: 及时对项目或者服务器Java应用性能进行性能检测,并且分析检测结果数据,发现热点代码是一项充满意义的工作,因为可能因为某一段热点代码会拖慢整个系统的运行,这是不可忍受的,发现热点代码之后需要及 ...
- 通过C#生成支付宝收款码 四(支付宝官方SDK配合沙箱生成收款二维码)
前面三个章节是学习和摸索过程,现在进入主题,生成收款码.还是用沙箱环境来调试. 1.新建windowsform程序,根据章节三,导入支付宝SDK. 2.下载官方当面付DEMO程序:当面付DEMO 3. ...
- 没有form的表单验证_PHP动态生成表单,内置17种常用组件并且支持表单验证!
FormBuilder 是一个开源的PHP表单生成器,可以快速生成现代化的form表单.还可以配合开源项目 xaboy/form-create 生成任何 Vue 组件 github | 文档 环境需求 ...
- 详解Dart中如何通过注解生成代码
简介:详解dart与java注解生成代码异同点 作者:闲鱼技术-龙湫 1.背景 最近在项目中使用到了Dart中的注解代码生成技术,这跟之前Java中APT+JavaPoet生成代码那套技术还是有一些不 ...
- 1024x1024 分辨率,效果惊人!InsetGAN:全身图像生成 (CVPR 2022)
关注公众号,发现CV技术之美 引言 该论文是出自于CVPR2022关于GAN的最新文章.要知道虽然目前GAN可以在某些领域的理想条件下能够生成逼真的图像,但由于发型.服装和姿势的多样性,生成全身人体图 ...
- 利用白加黑配合Veil过杀软
0x00 简介 所谓的"白"就是利用正常应用程序的一些特征,比如,签名.所谓的"黑"就是用msf或者其他程序生成的"恶意程序". 以下的例 ...
- java图片裁剪和java生成缩略图
一.缩略图 在浏览相册的时候,可能需要生成相应的缩略图. 直接上代码: public class ImageUtil {private Logger log = LoggerFactory.getLo ...
- jar 坐标系转换工具_java jar生成maven坐标
使用本地maven仓库地址,配合需要生成jar名进行匹配坐标 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import java. ...
最新文章
- python知乎-知乎大佬李启方道出肺腑之言:为什么我不建议你学Python?
- narwal无法连接机器人_懒无止境 能自己洗抹布的云鲸J1扫拖机器人
- Python基础——PyCharm版本——第三章、数据类型和变量(超详细)
- uni-app清理缓存数据_数据清理-从哪里开始?
- Spark 连接 HBase 入库及查询操作
- linux下的磁盘配额简介暨 linux下加挂硬盘续
- 64位window 7安装2TB以上大容量硬盘
- python打包的exe反编译_python打包exe反编译源码
- c 压缩java解压文件,java 压缩文件 解压缩文件
- 在Android手机上对https请求进行抓包
- 2020晓庄学院专转本C语言考试试卷,南京晓庄学院五年一贯制专转本模拟考试c语言...
- 普歌-码上鸿鹄团队:在Nuxt(vue)渲染模板中使用mock.js随机生成数据
- SAP BASIS ADM100 中文版 Unit 7(1)
- cold diffusion的个人理解
- maptalks+three.js+vue webpack项目实现二维地图上贴三维模型
- “移除”虚拟机和“从磁盘中删除”虚拟机的区别
- 当天邀请的饭局要参加吗?别说“我有安排”,高手都懂这3个礼数
- 微信撤回消息为何要提示对方?腾讯解答真相
- 2021年软考科目怎么选?
- 深度学习研究理解:OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks
热门文章
- informatica mysql的配置_Informatica 9.5.1 安装配置
- WINDOWS中用于锁定计算机的快捷键是,不同Windows版本,锁定计算机的快捷键是什么及还有什么锁定方法...
- 百分比布局Design页面无法显示 :The following classes could not be found 解决方法
- Dex.top“50计划”牵手IOST,赋能公链生态经济
- 邹城市计算机学业水平考试,山东省济宁市邹城市2020届九年级学业水平考试第一次模拟检测物理试题...
- html5 手游制作,HTML5游戏制作(九)——炮塔游戏
- python学习总结--字典
- Linux系统安全:安全技术和防火墙
- c语言if(a==1)和if(a ==‘1‘)的区别总结
- 电子统计台账:锁定某月台账数据,防止数据丢失