写在前面

  • mobileOG-db数据库github地址:

    https://github.com/clb21565/mobileOG-db

文章发表于2022年8月份。题目为:mobileOG-db: a Manually Curated Database of Protein Families Mediating the Life Cycle of Bacterial Mobile Genetic Elements;这个库更适合长序列注释,也就是contig更加适合这个库,我也对比了一下18年的那个可移动元件库,这个确实丰度的多。

  • DOI: https://doi.org/10.1128/aem.00991-22

  • 文章网络online地址:

    https://journals.asm.org/doi/10.1128/aem.00991-22

  • 一些有用的数据库备份:

    https://tehub.org/resources/repeat_databases

数据库和工具的使用

  • 数据库地址:

    https://mobileogdb.flsi.cloud.vt.edu/ (点击菜单栏下载完整数据库,200多M)

  • 这里的基因数量超过了80万,远比18年MobileGeneticElementDatabase数据库内容多。

安装专用的注释工具

首先建立conda虚拟环境,其次装依赖工具:

conda create -n mobileOG-db python=3.6.15
conda activate mobileOG-db
conda install -c conda-forge biopython
conda install -c bioconda prodigal
conda install -c bioconda diamond
conda install -c anaconda pandas

使用diamond构建索引

diamond makedb --in ./meta.mini.db/mobileOG-db/mobileOG-db_beatrix-1.6.All.faa -d ./meta.mini.db/mobileOG-db/mobileOG-db-beatrix-1.X.dmnd

添加可执行权限(最终没有使用这个工具)

chmod +x meta.mini.db/mobileOG-db/mobileOG-db-main/mobileOG-pl/mobileOGs-pl-kyanite.shPATH=$PATH:./meta.mini.db/mobileOG-db/mobileOG-db-main/mobileOG-pl/

直接使用diamond进行序列比对:

mkdir ./data/mobileOG/
diamond blastp -q ./data/allgenecalled.faa --db meta.mini.db/mobileOG-db/mobileOG-db-beatrix-1.X.dmnd --outfmt 6 stitle qtitle pident bitscore slen evalue qlen sstart send qstart qend -k 15 -o ./data/mobileOG/mobileOG.tsv -e 1e-20 --query-cover 90 --id 90#--作者写的py程序进行整理
python ./meta.mini.db/mobileOG-db/mobileOG-db-main/mobileOG-pl/mobileOGs-pl-kyanite.py --o ./data/mobileOG/mobileOG --i ./data/mobileOG/mobileOG.tsv -m ./meta.mini.db/mobileOG-db/mobileOG-db-beatrix-1.6-All.csv

修改注释代码,更加适合后续处理流程

修改一下吧,作者提供的工具与分析习惯不同。

time diamond blastp --db time diamond blastp --db meta.mini.db/mobileOG-db/mobileOG-db-beatrix-1.X.dmnd --query ./data/allgenecalled.faa      --outfmt 6 --threads 10 --max-target-seqs 1 --quiet -e 1e-5 --sensitive     --out data/mobileOG/gene_diamond.f6# 提取基因对应基因家族
cut -f 1,2 data/mobileOG/gene_diamond.f6 | uniq | \sed '1 i Name\tResGeneID' > data/mobileOG/gene_mobileOG.list

使用R语言整理后续 构造phyloseq对象

#---mobileOGdb#------
library(tidyverse)
dat = read.delim("./data/mobileOG/gene_mobileOG.list")
dim(dat)
dat$ID = sapply(strsplit(dat$ResGeneID, "[|]"), `[`, 1)
head(dat)#-数据库注释信息导入
dat$ResGeneID = sapply(strsplit(dat$ResGeneID , "_1"), `[`, 1)
db1 = read.csv("./meta.mini.db/mobileOG-db/mobileOG-db-beatrix-1.6-All.csv",header = TRUE)
head(db1)
colnames(db1)[4] = "name.gene"
db1$Amino.Acid.Sequence = NULLdat2 = dat %>% left_join(db1,by = c("ID" ="mobileOG.Entry.Name"))
head(dat2)
dim(dat2)
arpath = "./resulPlot.meta/mobileOG/"
dir.create(arpath)
write.csv(dat3,paste(arpath,"/mobileOG_all_info.csv",sep = ""),quote = F)library(data.table)
count = fread("./data/salmon/gene.count",header = T);count
colnames(count)[-1] =gsub("A","",colnames(count)[-1])
colnames(count)[-1] = paste("A",colnames(count)[-1],sep = "")library(tidyfst)
id = dat2$Name %>% unique()
otu = count %>% filter_dt(Name %in% id) %>% as.data.frame() %>% column_to_rownames("Name")
head(otu)write.csv(otu,paste(arpath,"/mobileOG_count_tab.csv",sep = ""),quote = F)head(dat2)
dat2$Name %>% # unique() %>% length()tax = dat2%>% distinct(Name,.keep_all = TRUE)  %>%column_to_rownames("Name")
library(phyloseq)
ps = phyloseq(otu_table(as.matrix(otu),taxa_are_rows = TRUE),tax_table(as.matrix(tax))
)map = read.delim("./data/metaGroup.txt")
head(map)
row.names(map) = map$ID
sample_data(ps) = map
pssaveRDS(ps,"./data/ps_mobileOG.rds")根际互作生物学研究室 简介根际互作生物学研究室是沈其荣院士土壤微生物与有机肥团队下的一个关注于根际互作的研究小组。本小组由袁军副教授带领,主要关注:1.植物和微生物互作在抗病过程中的作用;2 环境微生物大数据整合研究;3 环境代谢组及其与微生物过程研究体系开发和应用。团队在过去三年中在 Microbiome,ISME J,Fundamental Research,iMeta, PCE,SBB,Horticulture Research,SEL,BMC plant biology等期刊上发表了多篇文章。欢迎关注 微生信生物 公众号对本研究小组进行了解。
撰写:文涛
修改:文涛审核:袁军
团队工作及其成果 (点击查看)
  • 团队关注

  • 团队文章成果

  • 团队成果-EasyStat专题

  • ggClusterNet专题

  • 袁老师小小组

猜你喜欢

iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索  Endnote

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

点击阅读原文,跳转最新文章目录阅读

适合宏基因组的可移动元件数据库mobileOG的使用相关推荐

  1. PICRUSt2:OTU/ASV等16S序列随意预测宏基因组,参考数据库增大10倍

    PICRUSt推出了近6年,引用2500余次. 现推出PICRUSt2 https://github.com/picrust/picrust2 具有以下三大优势: 任何OTU/ASV直接预测功能: 数 ...

  2. 你想要的宏基因组-微生物组知识全在这(2023.01)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  3. 你想要的宏基因组-微生物组知识全在这(2022.12)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  4. 你想要的宏基因组-微生物组知识全在这(2023.3)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  5. 你想要的宏基因组-微生物组知识全在这(2023.7)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  6. 你想要的宏基因组-微生物组知识全在这(2023.4)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  7. 你想要的宏基因组-微生物组知识全在这(2023.5)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  8. 你想要的宏基因组-微生物组知识全在这(2023.8)

    欢迎点击上方蓝色"宏基因组"关注我们! 宏基因组/微生物组是当今世界科研最热门的研究领域之一,为加强宏基因组学技术和成果交流传播,推动全球华人微生物组领域发展,中科院青年科研人员创 ...

  9. 你想要的宏基因组-微生物组知识全在这(2020.5)

    文章目录 征稿.转载.合作 文章分类导航目录 精选文章推荐 会议.招聘广告 科研经验 软件流程 扩增子分析 扩增子教程 QIIME2教程(2020.2) 易生信-扩增子教程 Webserver在线分析 ...

最新文章

  1. 大数据时代涉军网络舆情引导的“5个结合”
  2. DDD 领域驱动设计:贫血模型、充血模型的深入解读!
  3. GetLastError返回值的意义----适用在eVC和VC++
  4. 程序员水平分级 你属于哪一类?
  5. 九章算法强化班 - 课程大纲
  6. laravel php7.2报错,laravel,php_运行php artisan serve时报错,laravel,php - phpStudy
  7. 中小企业上云多地域办公组网(SAG)解决方案
  8. 6美元进公园随便挖钻石
  9. c语言健身房会员管理系统,健身房会员管理系统c#.net
  10. Hibernate之一对一映射
  11. 免校准的电量计量芯片_电能计量芯片应用心得之选型篇
  12. itextpdf 合并单元格 横向纵向
  13. 获取实际ip地址(与在百度输入IP搜索得到的ip地址相同,即真实IP地址
  14. 学习笔记:GAMES101图形学入门闫令琪(五)抗锯齿
  15. [MCM] MTSP问题的GA求解 多目标优化 (单起点 与 多起点)
  16. WORD出错:设置为稿纸后,右键的字体、段落项目变灰
  17. 超炫的html5擦除效果,超炫html5效果代码(需浏览器支持)
  18. Android 8.1 中Systemui中的常见修改(二)电池的修改
  19. 51单片机基础之继电器
  20. gmod服务器文件,Garry’s Mod|Gmod服务器架设教程(四)挂载创意工坊插件

热门文章

  1. 三毛最伤心的100句话
  2. 婴幼儿用品行业打破传统经营模式 开启全渠道会员营销逆袭之路
  3. Failed to list units: No such method ‘ListUnitsFiltered‘ systemctl list-units
  4. C/C++中float与double的范围和精度详解
  5. matlab中im2bw函数的用法
  6. php 跳板机连接mysql,Navicat配置跳板机连接数据库
  7. 为啥要放引流条_什么情况不放引流条
  8. 通过子节点查找父节点
  9. 人工智能导论(6)——机器学习(Machine Learning)
  10. 压力变送器如何安装使用?