qiime设置傻瓜化,安装起来欲仙欲死,操作起来爽翻天。第一次用qiime就发觉这个软件果然酸爽。

公司测序回来发了好几个文件回来,我选择质量控制并拼接好的数据直接上手。

P.S.文件暂缺,后面会补上

质控并拼接好的样品为:trim.2.fq, trim.4.fq, trim.7.fq, trim.11.fq, trim.14.fq, trim.18.fq, trim.19.fq, trim.23.fq, trim.25.fq, trim.28.fq, trim.31.fq, trim.35.fq, trim.37.fq, trim.41.fq, trim.44.fq,合计15个样品。样品如果使用qiime拆分的话,序列如下(以2号样为例):

@2_241533    M02419:322:000000000-BDP8B:1:2119:24295:14257 1:N:0:CAAGAC    orig_bc=CTGTA    new_bc=CTGTA    bc_diffs=0
TACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGTGCGTAGGTGGCTAGGTAAGTCAGATGTGAAAACCCAGGGCTTAACTTTGGGACTGCATTTGAAACTGCTTGGCTAGAGTGCAGGAGAGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACTGTAACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGAAACCCTTGTAGTCC
+
GGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGGGGGGGGGGGGGGGGGGGDGGGGGGGFGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGFGGGGGGGGGGGGGGEGGGGGGGGGGGFGGGGGGGGGGGGGGGGGGGGGGGGGGGGGFE;FGGGGGGGGGGFGGGGGGGGGGGGGFGGGG
...

序列命名必须以@样品名_数字开头。下面开始正式处理:

1. 文件合并

> cat 文件1 文件2 ... > 合并文件

cat trim.2.fq trim.4.fq trim.7.fq trim.11.fq trim.14.fq trim.18.fq trim.19.fq trim.23.fq trim.25.fq trim.28.fq trim.31.fq trim.35.fq trim.37.fq trim.41.fq trim.44.fq > seq.fq

也可以利用通配符一下搞定

cat *.fq > seq.fq

P.S.图形操作界面:选中文件夹中所有文件,右键选择属性,复制所文件名到新文本中,替换“,”。

2.利用Mothur拆分fq文件

mothur > fastq.info(fastq=seq.fq)

3.打开qiime软件

export PATH=~/miniconda2/bin:$PATH #设定conda路径,不知道为啥我这个每次用都要重设一下
source activate qiime1

打开后显示如下

(qiime1) ruminant@ruminant-PowerEdge-T630[qiimeOTU] 

4. 看一下序列分布

count_seqs.py -i seq.fasta

结果显示为:

551360  : seq.fasta (Sequence lengths (mean +/- std): 272.8898 +/- 0.5639)
551360  : Total

长度基本分布在273,和我们预期长度一致。P.S.看序列分布和长度还是用Mothur比较爽,后面讲到Mothur再说。

5.OTUpicking

先准备一个配置文件:params.txt,正反向比对都打开,因为测序的可能是负链也可能是正链。文件内容如下:

pick_otus:enable_rev_strand_match True

用官方推荐的open_reference的方法做聚类,默认的reference是greengene13.8(老掉牙了,看到Mothur和Usearch在可劲的喷该数据库),在/usr/share/qiime/data/gg_13_8_otus/rep_set。-r修改参考基因,-m修改聚类方法。15个样的数据量大概需要20分钟,简直是飞快。

pick_open_reference_otus.py -o otus1/ -i seq.fasta -p params.txt -r /usr/share/qiime/data/gg_13_8_otus/rep_set/97_otus.fasta

生成biom格式otu表2个:otu_table_mc2.biom, otu_table_mc2_w_tax.biom,前一个没有注释,后一个有注释

6.转换biom文件

biom格式不是给人看的,简直累死。我们用biom程序转化他为我们熟悉的二维表

cd otus1
biom convert -i otu_table_mc2.biom -o otutable.txt --to-tsv
biom convert -i otu_table_mc2_w_tax.biom -o otutable_tax.txt --to-tsv #注释结果没在表里
biom convert -i otu_table_mc2_w_tax.biom -o otutable_tax.txt --to-tsv --header-key taxonomy #注释结果在表里

代表序列在文件rep_set.fna,树文件在rep_set.tre。

可选步骤. 如果没有注释出来,可以用Mothur注释OTU

mothur> classify.seqs(fasta=rep_set.fna,  template=/home/ruminant/Documents/database/tax&seqs/greengene/gg_13_8_99.fasta, taxonomy=/home/ruminant/Documents/database/tax&seqs/greengene/gg_13_8_99.gg.tax)

在此生成了一个rep_set.gg.wang.taxonomy的文件,内容就是OTU和对应的物种。本次有5000多个OTU,我决定用libreoffice calc来处理,还是可视化的界面比较爽。OTU表格中新建一列Taxonomy,Q3中输入=VLOOKUP(A3,[rep_set.gg.wang.taxonomy]rep_set.gg.wang!$A:$B,2,0),填充手柄填充,大功告成。OTU表长这个样子:

Mothur配合qiime生成otutable相关推荐

  1. Linux下构建自己的C++共享库并配合pkg-config生成链接选项

    Linux下构建自己的C++共享库并配合pkg-config生成链接选项 本文将以C++链表的新建.打印操作为例构建自己的共享库,并在实际调试代码时尝试使用.我们在做数据结构题时经常需要将链表打印出来 ...

  2. Java应用性能分析工具:async-profiler(配合FlameGraph生成火焰图)

    前言: 及时对项目或者服务器Java应用性能进行性能检测,并且分析检测结果数据,发现热点代码是一项充满意义的工作,因为可能因为某一段热点代码会拖慢整个系统的运行,这是不可忍受的,发现热点代码之后需要及 ...

  3. 通过C#生成支付宝收款码 四(支付宝官方SDK配合沙箱生成收款二维码)

    前面三个章节是学习和摸索过程,现在进入主题,生成收款码.还是用沙箱环境来调试. 1.新建windowsform程序,根据章节三,导入支付宝SDK. 2.下载官方当面付DEMO程序:当面付DEMO 3. ...

  4. 没有form的表单验证_PHP动态生成表单,内置17种常用组件并且支持表单验证!

    FormBuilder 是一个开源的PHP表单生成器,可以快速生成现代化的form表单.还可以配合开源项目 xaboy/form-create 生成任何 Vue 组件 github | 文档 环境需求 ...

  5. 详解Dart中如何通过注解生成代码

    简介:详解dart与java注解生成代码异同点 作者:闲鱼技术-龙湫 1.背景 最近在项目中使用到了Dart中的注解代码生成技术,这跟之前Java中APT+JavaPoet生成代码那套技术还是有一些不 ...

  6. 1024x1024 分辨率,效果惊人!InsetGAN:全身图像生成 (CVPR 2022)

    关注公众号,发现CV技术之美 引言 该论文是出自于CVPR2022关于GAN的最新文章.要知道虽然目前GAN可以在某些领域的理想条件下能够生成逼真的图像,但由于发型.服装和姿势的多样性,生成全身人体图 ...

  7. 利用白加黑配合Veil过杀软

    0x00  简介 所谓的"白"就是利用正常应用程序的一些特征,比如,签名.所谓的"黑"就是用msf或者其他程序生成的"恶意程序". 以下的例 ...

  8. java图片裁剪和java生成缩略图

    一.缩略图 在浏览相册的时候,可能需要生成相应的缩略图. 直接上代码: public class ImageUtil {private Logger log = LoggerFactory.getLo ...

  9. jar 坐标系转换工具_java jar生成maven坐标

    使用本地maven仓库地址,配合需要生成jar名进行匹配坐标 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import java. ...

最新文章

  1. python知乎-知乎大佬李启方道出肺腑之言:为什么我不建议你学Python?
  2. narwal无法连接机器人_懒无止境 能自己洗抹布的云鲸J1扫拖机器人
  3. Python基础——PyCharm版本——第三章、数据类型和变量(超详细)
  4. uni-app清理缓存数据_数据清理-从哪里开始?
  5. Spark 连接 HBase 入库及查询操作
  6. linux下的磁盘配额简介暨 linux下加挂硬盘续
  7. 64位window 7安装2TB以上大容量硬盘
  8. python打包的exe反编译_python打包exe反编译源码
  9. c 压缩java解压文件,java 压缩文件 解压缩文件
  10. 在Android手机上对https请求进行抓包
  11. 2020晓庄学院专转本C语言考试试卷,南京晓庄学院五年一贯制专转本模拟考试c语言...
  12. 普歌-码上鸿鹄团队:在Nuxt(vue)渲染模板中使用mock.js随机生成数据
  13. SAP BASIS ADM100 中文版 Unit 7(1)
  14. cold diffusion的个人理解
  15. maptalks+three.js+vue webpack项目实现二维地图上贴三维模型
  16. “移除”虚拟机和“从磁盘中删除”虚拟机的区别
  17. 当天邀请的饭局要参加吗?别说“我有安排”,高手都懂这3个礼数
  18. 微信撤回消息为何要提示对方?腾讯解答真相
  19. 2021年软考科目怎么选?
  20. 深度学习研究理解:OverFeat:Integrated Recognition, Localization and Detection using Convolutional Networks

热门文章

  1. informatica mysql的配置_Informatica 9.5.1 安装配置
  2. WINDOWS中用于锁定计算机的快捷键是,不同Windows版本,锁定计算机的快捷键是什么及还有什么锁定方法...
  3. 百分比布局Design页面无法显示 :The following classes could not be found 解决方法
  4. Dex.top“50计划”牵手IOST,赋能公链生态经济
  5. 邹城市计算机学业水平考试,山东省济宁市邹城市2020届九年级学业水平考试第一次模拟检测物理试题...
  6. html5 手游制作,HTML5游戏制作(九)——炮塔游戏
  7. python学习总结--字典
  8. Linux系统安全:安全技术和防火墙
  9. c语言if(a==1)和if(a ==‘1‘)的区别总结
  10. 电子统计台账:锁定某月台账数据,防止数据丢失