在线通路注释,一般使用DAVID、KASS、KOBAS等工具。

Kobas : KOBAS(基于KEGG Orthology Based Annotation System)是用于基因/蛋白质功能注释(注释模块)和功能集富集(Enrichment module)的Web服务器。给定一组基因或蛋白质,它可以确定通路,疾病和基因本体论(GO)术语是否显示统计学显着性。

KOBAS 3.0由两个功能组成,注释(Annotation)和富集(Enrichment)

KOBAS 3.0的输入不支持gene symbol,一般操作将Symbol ID转换成Entrez Gene ID(或者)ensembl格式的ID。

推荐进行基因ID转换的网站:gprofiler : http://biit.cs.ut.ee/gprofiler/gconvert.cgi

注释(Annotation):

对于Annotation模块,它接受基因/蛋白质列表作为输入,包括ID或序列。 对于每个基因,您可以找到与该基因相关的途径,疾病和基因本体(GO).

富集(Enrichment)

富集模块为您提供答案,了解哪些途径,疾病和GO术语与您刚输入的基因/蛋白质具有统计学意义。

该模块在KOBAS 2.0中称为“识别”。它接受与Annotation模块相同的输入格式,并且还允许Annotation模块的结果作为输入(请参阅3.1中的详细信息)。它基于第一代基因集富集方法,一种称为过表达分析(ORA)的基因水平统计,这是一种基于超几何分布的简单且经常使用的测试。

注意事项:

输入数据:

1、Gene/protein ID、Sequences(FASTA format)、Tabular BLAST output

2、Gene expression matrix

输出结果:

  • Term KEGG的注释类
  • Database 数据库类型
  • ID Term对应的ID
  • Input 输入的基因数目
  • input number 富集到这个Term的输入基因个数
  • Background number 数据库中富集到这个通路的总有基因数量
  • P-value P值
  • Corrected P-Value 校正后P值

KOBAS 本地操作:

下载 应用: http://kobas.cbi.pku.edu.cn/kobas-2.1.1/kobas-3.0.3.tar.gz

下载 数据库: http://kobas.cbi.pku.edu.cn/download_file.php?type=seq_pep&filename=ko.pep.fasta.gz

### 1、KO数据库建索引
$ diamond makedb --in ko.pep.fasta --db ko -p 24### 2、diamond blast
$ diamond blastx -e 1e-5 --db ko -q genes.nucleotide.catalog.fa -p 24 -f 6 qseqid qlen qstart qend qcovhsp slen sstart send score evalue positive length ppos sseqid stitle nident mismatch gaps gapopen bitscore pident -o kobas.annotation### 转成Tabular BLAST output format
$ awk -F "\t" '{print $1"\t"$14"\t"$21"\t"$12"\t"$17"\t"$19"\t"$3"\t"$4"\t"$7"\t"$8"\t"$10"\t"$20}' kobas.annotation > kobas.annotation.m8### 注释
$ annotate.py -i kobas.annotation.m8 -t blastout:tab -s ko -o kegg.annotate.tmp### 检测
$ identify.py -f kegg.annotate.tmp -o kegg.identify.tmp -p K -m h -b tmp### 富集
$ cluster.py -i kegg.identify.tmp -m k -o kegg.cluster.txt ### 查看注释结果
$less kegg.annotate.tmp
##ko    KEGG Orthology
##Method: BLAST Options: evalue <= 1e-05; rank <= 5
##Summary:      3431 succeed, 2654 fail#Query  KO ID|KO name|Hyperlink
### 序列  K号|酶号   基因|ko pathway路径
gene_3301|GeneMark.hmm|1482_nt|+|3899966|3901447        K00045|E1.1.1.67, mtlK|http://www.genome.jp/dbget-bin/www_bget?ko:K00045
gene_3075|GeneMark.hmm|774_nt|+|3605726|3606499 K01692|paaF, echA|http://www.genome.jp/dbget-bin/www_bget?ko:K01692
gene_1278|GeneMark.hmm|1332_nt|+|1517095|1518426        None
......Query:                  gene_3301|GeneMark.hmm|1482_nt|+|3899966|3901447
KO:                     K00045  E1.1.1.67, mtlK
Pathway:                Fructose and mannose metabolism KEGG PATHWAY    ko00051Query:                  gene_3075|GeneMark.hmm|774_nt|+|3605726|3606499
KO:                     K01692  paaF, echA
Pathway:                Fatty acid degradation  KEGG PATHWAY    ko00071Tryptophan metabolism   KEGG PATHWAY    ko00380
....

功能富集分析概述 : https://www.jianshu.com/p/5a4bda169247

KOBAS 3.0学习相关推荐

  1. mysql5.0镜像_Mysql5.0学习笔记(一)

    Mysql5.0学习笔记(一) -基本sql语句与支持字符集 1.登录 mysql -h localhost -u root 2.创建用户firstdb(密码firstdb)和数据库,并赋予权限于fi ...

  2. asp.net2.0学习历程 菜鸟到中级程序员的飞跃【月儿原创】

    asp.net2.0学习历程 菜鸟到中级程序员的飞跃 --30本好书点评 作者:清清月儿 主页:http://blog.csdn.net/21aspnet/           时间:2007.5.1 ...

  3. [EntLib]微软企业库5.0 学习之路——第五步、介绍EntLib.Validation模块信息、验证器的实现层级及内置的各种验证器的使用方法——上篇...

    本文是为后面的学习之路做铺垫,简单介绍下企业库中的Validation模块的一些相关知识,包括Validation模块的简介.用途.使用方法.默认提供的多种验证器的介绍等. 一.简介及用途 在实际的项 ...

  4. tensorflow 1.0 学习:参数和特征的提取

    tensorflow 1.0 学习:参数和特征的提取 在tf中,参与训练的参数可用 tf.trainable_variables()提取出来,如: #取出所有参与训练的参数 params=tf.tra ...

  5. ASP.NET MVC 3.0学习系列文章—Model in ASP.NET MVC 3.0

    系列文章 ASP.NET MVC 3.0学习系列文章-序 ASP.NET MVC 3.0学习系列文章--Razor and ASP.NET MVC 3.0 ASP.NET MVC 3.0学习系列文章- ...

  6. Microsoft .NET Pet Shop 4.0 学习之旅(三) - 项目的引用关系2

    Microsoft .NET Pet Shop 4.0 学习之旅(三) 项目的引用关系2 <?xml:namespace prefix = o ns = "urn:schemas-mi ...

  7. [EntLib]微软企业库5.0 学习之路——第七步、Cryptographer加密模块简单分析、自定义加密接口及使用—上篇...

    在完成了后,今天开始介绍企业库中的新模块:Cryptographer(加密模块),这个模块在日常的大多数项目的作用非常重要,例如:网站会员密码.身份证号.网站配置等,通过对信息进行加密可以保证项目数据 ...

  8. ExtJs2.0学习系列--Ext.Panel

    ExtJs2.0学习系列--Ext.Panel 2008-06-29 12:59 上一篇文章ExtJs2.0学习系列(1)--Ext.MessageBox ,受到了大家的褒贬不一,还是有的朋友提出好的 ...

  9. (转)[EntLib]微软企业库5.0 学习之路——第十步、使用Unity解耦你的系统—PART2——了解Unity的使用方法(1)...

    原文地址:http://www.cnblogs.com/kyo-yo/archive/2010/11/01/Learning-EntLib-Tenth-Decoupling-Your-System-U ...

最新文章

  1. sap可以指定应用服务器,SAP扫盲系列之一:什么是SAP系统和应用服务器
  2. 设计模式详解(总纲)
  3. ViewPager的简单使用说明
  4. matlab图像处理——平滑滤波
  5. just函数 python_在python里写Monad
  6. GDCM:gdcm::PixelFormat的测试程序
  7. asp子窗口读取父窗口数据_算法与数据结构基础 - 数组(Array)
  8. 中国船级社船舶设计审核云平台
  9. [导入]身份验证方面的问题
  10. Flutter AnimatedAlign 使用解析
  11. TortoiseSVN中的“文件和文件夹过滤”在VS项目中的使用
  12. SpringBoot +自定义dao框架 自定义注解管理多数据源与事务
  13. linux备份目录命令tar,Linux中使用tar命令备份与还原数据
  14. canvas实现虚线带箭头效果
  15. 人工智能+建筑,会产生什么?
  16. [UE4]使用UMG的用户界面,设置UMG的模块依赖性(C++)
  17. python安卓-如何用python写一个安卓APP?(上)
  18. 台湾最大IC封装厂近三成员工停工14天,安世半导体宣布今日起调涨价格!
  19. 在美团点评当工程师的第一年总结
  20. Kafka组件connector使用详解

热门文章

  1. 北京工作居住证续签注意的问题
  2. 更改autocad 07为传统的二维绘图界面
  3. 用VS2005打开方案出现“此安装不支持该项目类型
  4. linux 报错:http://people.centos.org/tru/devtools-2/7/x86_64/RPMS/repodata/repomd.xml: [Errno 14]
  5. NER依存关系模型:原理,建模及代码实现
  6. MySQL - 全局锁、表级锁、行级锁、元数据锁、自增锁、意向锁、共享锁、独占锁、记录锁、间隙锁、临键锁、死锁
  7. JAVA:实现RodCutting棒材切割问题算法(附完整源码)
  8. excel sumifs()对多列求和
  9. 深访杨超越杯编程大赛发起人 还原硬核粉丝追星全过程
  10. 读《Oracle 数据库应用与实践》