微生物 OTU ASV Feature table过滤2 基于qiime2的bar plot导出的
#导入的是直接bar导出的csv【有group变量】
originaldata=read.csv("level-6.csv.csv",row.names = 1,header=F)
dim(originaldata)
data1=originaldata
ncol(data1)
data1 <- data1[,-114] #去掉最后一列分组的
ncol(data1)
data2 <- as.data.frame(t(data1))
library(tidyverse)
data3 <- rownames_to_column(data2,var='id')
nrow(data3)
taxonomy <- data3[1:113,1:2]
#检查下
table(taxonomy$id == rownames(data2))#用来过滤的数据是
#去掉第一行
data <- data1[-1,]data[1:3,1:3] #此时的{行=样本} 列为OTU#转化为数值
dim(data) #
str(data[1:3]) #需要转化成数值
data[,1:113]<-lapply(data[,1:113],as.numeric)
#ASVs with fewer than 10 reads were removed.
data[data < 10] <- 0#过滤方法1
library(Hmisc)#相对丰度转化A=data #行=样本
C=A/rowSums(A)
genus=t(C)#可选事先过滤一些低丰度或低频的类群,行=OTU
#例如只保留相对丰度总和高于 0.02% 的属
genus <- genus[which(rowSums(genus) >= 0.0002), ] genus1 <- genus
#大于0的赋值为1
genus1[genus1>0] <- 1
#上一步大于0变成1后,下一步合算1多少个,保留下来 259*20%=51.8
genus <- genus[which(rowSums(genus1) >=52 ), ]
#例如只保留在 52个及以上样本中出现的属#合并Taxonomy
genus <- as.data.frame(genus)
genus2 <- rownames_to_column(genus,var='no')final <- left_join(genus2,taxonomy,by=c('no'='id')) #向data1的names1有的合并(全部变量)
final <- select(final,index,everything())
final <- select(final,-no)
final[1:2,1:2]
#导出数据
write.csv(final,"L6_filter_0.0002.csv",row.names =FALSE )
微生物 OTU ASV Feature table过滤2 基于qiime2的bar plot导出的相关推荐
- OTU/ASV/Feature tabel 表格 过滤 相对丰度 微生物
自己看微生物 扩增子或宏基因组文章的材料方法,找过滤标准 然后转化成相对丰度 #导入数据 #行=样本 列=OTU data=read.csv("L6.csv",row.names ...
- PICRUSt2:OTU/ASV等16S序列随意预测宏基因组,参考数据库增大10倍
PICRUSt推出了近6年,引用2500余次. 现推出PICRUSt2 https://github.com/picrust/picrust2 具有以下三大优势: 任何OTU/ASV直接预测功能: 数 ...
- 根据代表性序列预测OTU/ASV生活史策略——寡营养型or富营养型
一.原理介绍 丰富的资源会促进细菌的生长,特别是富营养型细菌的生长.快速的生长需要大量的核糖体,富营养性细菌会持有更多的核糖体RNA操纵子(number of ribosomal RNA operon ...
- 2021-10-29【微生物】丨基于qiime2工具16S/ITS分析全套流程(上)
目录 摘要 工具与方法 流程与命令 数据录入,去重与质控 结果展示 生成features table(OTU) 结果展示 发育树生成 部分结果展示 注释分类 结果展示 总结 摘要 前两个月项目特别多, ...
- tensorflow 协同过滤_基于django和协同过滤/cnn的电影推荐系统
技术 前端: bootstrap3 + vue + jquery 后端: django 2.2.1 +djangorestframework (MVC框架) 数据库: mysql 数据集: 1. 豆瓣 ...
- 推荐机制 协同过滤和基于内容推荐的区别
基于人口统计学的推荐 基于人口统计学的推荐机制(Demographic-based Recommendation)是一种最易于实现的推荐方法,它只是简单的根据系统用户的基本信息发现用户的相关程度,然后 ...
- 协同过滤算法概述与python 实现协同过滤算法基于内容(usr-item,item-item)
协调过滤推荐概述 协同过滤(Collaborative Filtering)作为推荐算法中最经典的类型,包括在线的协同和离线的过滤两部分.所谓在线协同,就是通过在线数据找到用户可能喜欢的物品,而离线过 ...
- 如何使用Spring+SpringMVC+Mybatis开发实现个性化小说推荐系统 协同过滤推荐算法实现 基于用户、项目的协同过滤推荐 基于聚类、关联规则、内容推荐算法 WebNovelCFRS
如何使用Spring+SpringMVC+Mybatis开发实现个性化小说推荐系统 协同过滤推荐算法实现 基于用户.项目的协同过滤推荐 基于聚类.关联规则.内容推荐算法 WebNovelCFRS 一. ...
- 基于Qiime2处理Silva数据库
生物信息学习 提示:仅供学习交流使用. 基于Qiime2处理Silva数据库 前言 一.安装Qiime2 二.通过Qiime2下载Silva数据库 1.RESCRIPt安装 2.下载处理Silva数据 ...
最新文章
- 色彩(颜色)空间原理(实现代码)
- 程序员能力矩阵 Programmer Competency Matrix
- USTC English Club Note20171011
- leetcode1432. 改变一个整数能得到的最大差值(贪心)
- 【学习笔记】第三章——内存 IV(虚拟内存、请求分页、页面置换、缺页中断、抖动现象)
- Python 小白从零开始 PyQt5 项目实战(4)基本控件
- php intval trim,php数据入库前清理 注意php intval与mysql的int取值范围不同_PHP教程
- java excel odbc_Java:无法使用JDBC ODBC更新Excel
- cmd输入pip报错_Houdini安装外部python库(pip)
- 深井软岩巷道群支护技术与应用_金能煤业公司组织观看千米深井软岩巷道大变形机理及围岩控制技术讲座...
- sql查看数据库线程数_SQL Server始终在可用性组数据库上的最大辅助线程
- css + div + js 制作HTML tab control
- 一个人学的软件测试,到底有多难?
- nginx 优化配置
- 想入行SAP咨询,最具性价比的方式
- uint8_t范围_uint8_t / uint16_t / uint32_t /uint64_t 是什么数据类型 - 大总结
- 模拟卷Leetcode【普通】714. 买卖股票的最佳时机含手续费
- C++ 农夫过河问题
- SAP 在途库存与中转库存
- bfd的文件格式识别