qiime2+biom+qiime1获得16S物种丰度
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?
当然,有许多方法可以实现,比如用shell, R, python脚本,或者再简单粗暴点,excel解决,透视表,公式,宏等。自己造轮子总是觉得不怎么踏实,出错咋办。那么,现成的软件有哪些呢,在这里,我抛砖引玉,提出一个曲线救国的方法,使用qiime2的前任qiime1解决,稍微做几步处理即可。如果你有更好的方法,欢迎交流和推荐,我们共同学习的进步!
这里我就从qiime2得出的结果直接开始,参考了生信菜鸟团大神的推文,这个大神的教程以全面著称,推荐学习!
1.导出物种分类信息和置信度
获得taxonomy.tsv,这个文件,其实把qza文件重命名为zip解压,或者qzv可视化文件导出,得到的文件也应该是一样的。
qiime tools export \--input-path taxa/taxonmony.qza --output-path taxa
文件是类似这样一个:
Feature ID | Taxon | Confidence |
---|---|---|
#q2:types | categorical | categorical |
OTU_1 | k__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__; g__; s__ | 0.8316610949745203 |
2.导出 BIOM 表,并加入将物种分类注释信息:
这一步就是处理下表头,让他兼容biom格式。注意,这个sed在mac下命令不能用,暂不确定是什么原因,我是用docker-ubuntu解决的。
#处理表头
sed -i -e '1 s/Feature/#Feature/' -e '1 s/Taxon/taxonomy/' taxa/taxonomy.tsv
#导出otu(feature)表
qiime tools export \--input-path deblur_output/table_final.qza \--output-path table_exported
#添加物种注释信息
biom add-metadata \-i deblur_output_exported/feature-table.biom \-o deblur_output_exported/feature-table_w_tax.biom \--observation-metadata-fp taxa/taxonomy.tsv \--sc-separated taxonomy
#biom转换成txt格式
biom convert \-i deblur_output_exported/feature-table_w_tax.biom \-o deblur_output_exported/feature-table_w_tax.txt \--to-tsv \--header-key taxonomy
3.qiime1获利各级分类结果
其实只需要biom格式就好了,唯一不足的是没有把上几级别的分类去除,比如属级别,还包括门纲目科,还不是usearch那种直接就是这个分类的结果。但是根据我的经验,usearch的物种注释结果可能不如qiime2的分类效果好,所以怎样结合这两个方法是个需要解决的问题。
#结果按门、纲、目、科、属五个级别进行分类汇总,对应结果的L2-L6
summarize_taxa.py -i result/otu_table3.biom -o result/sum_taxa # summary each level percentage
好的,我的分享就到这里,期待大家有更好的解决方案。
qiime2+biom+qiime1获得16S物种丰度相关推荐
- 使用R语言获得16S物种丰度
还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table() ...
- 16S 物种丰度热图学习
### 1. 关于热图的用途(参考http://www.360doc.com/content/17/0729/17/45848444_675155815.shtml) 以RNA-seq为例,热图可以: ...
- 物种丰度排序堆积柱形图及处理间各物种差异分析
物种丰度排序堆积柱形图及处理间各物种丰度非参数检验多组比较的R图形可视化 再美的可视化图形若缺少了统计检验就失去了灵魂而变得华而不实 测试数据及代码链接:https://pan.baidu.com/s ...
- ggplot2版聚类物种丰度堆叠图
文章目录 写在前面 加载依赖关系 导入数据 ggtree绘制聚类树 物种组成数据 整理成facet需要的格式 保证颜色填充独立性 分面组合树和柱图 修改配色 ggtree调整布局 添加样本其他信息 树 ...
- R统计绘图-随机森林分类分析及物种丰度差异检验组合图
此文主要涉及随机森林组间变量重要性和物种丰度差异检验绘图,包含以下几部分内容: 1)随机森林分类: 2)随机森林分类变量重要性绘图: 3)物种丰度差异检验绘图 4)随机森林分类变量重要性及物种丰度差异 ...
- 按照物种丰度对OTU表格进行拆分-丰富和稀有物种识别
稀有物种 (rare taxa, RT),在所有的样本中丰度均低于0.1%: 丰富物种 (abundant taxa, AT),在所有的样本中丰度均高于1%: 中等物种 (moderate taxa, ...
- R堆叠柱状图各成分连线画法:突出展示组间物种丰度变化
作者:朱微金 李陈浩 堆叠柱状图连线画法 提出问题 18年1月29日宏基因组转载了中科院生态中心邓晔组的文章<土壤细菌定量方法结合相对丰度分析揭示种群的真实变化 >.其中的图3基于堆叠柱状 ...
- 相对丰度柱状图matlab,R堆叠柱状图各成分连线画法:突出展示组间物种丰度变化...
作者:朱微金 李陈浩 堆叠柱状图连线画法提出问题 18年1月29日宏基因组转载了中科院生态中心邓晔组的文章<土壤细菌定量方法结合相对丰度分析揭示种群的真实变化 >.其中的图3基于堆叠柱状图 ...
- R统计绘图 | 物种组成冲积图(绝对/相对丰度,ggalluvial)
一.数据准备 数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据.此数据为虚构,可用于练习,请不要作他用. # 1.1 设置工作路径 #knitr::opts_knit$ ...
最新文章
- 关于预付卡,您需要知道的事儿
- 51Nod --1133 不重叠的线段
- 递归二分查找时间复杂度、空间复杂度和稳定性
- 巧用iptables搞定SYN洪水攻击!
- (笔试题)最大覆盖点
- 网络1711c语言第0次作业总结
- 《数据库SQL实战》获取当前(to_date='9999-01-01')薪水第二多的员工的emp_no以及其对应的薪水salary
- php 逗号 分割字符串
- 躺平,躺下就能赢吗?
- java 注销变量_[ Java学习基础 ] Java对象的创建和销毁
- emacs php 支持,emacs支持golang吗
- oracle把所有表查询权限赋与另一用户
- GBDT的回归、二分类以及多分类教程
- Matlab关键规则挖掘尿片啤酒,电商数据挖掘之关联算法(一):“啤酒+尿布”的关联规则是怎么来的...
- 粒子群优化算法的实现
- mac连接服务器出错双系统,mac使用bootcamp安装双系统遇到的问题及解决方案
- iconv 判断字符编码_iconv函数文字编码格式转换
- 域名系统(Domain Name System,DNS)
- 户外便携吹尘器方案浅析
- gltf 2.0快速入门