GO功能注释-简单快速
参考:https://www.cnblogs.com/xiaojikuaipao/p/7190779.html https://blog.csdn.net/ygyxl/article/details/79742751
GO 注释主要有两种方法:序列相似性比对(BLAST)和结构域相似性比对(InterProScan)
1. 将基因序列与 swiss-prot 蛋白质数据库进行 BLAST 比对,得到如下结果:
c00_g1_i1 RNF13_MOUSE 52.00 50 23 1 17 166 240 288 2e-11 65.5
c01_g1_i1 RS25_NEUCR 78.72 94 20 0 375 94 1 94 1e-32 116
其中,第二列为 swiss-prot 蛋白质数据库序列的 ID(UniProtKB ID)。
2. 注释
从 ftp://ftp.pir.georgetown.edu/databases/idmapping 下载 idmapping.tb.gz,该文件共有 22 列(tab 键分割),如:
Q6GZX4 001R_FRG3G 2947773 YP_031579.1 81941549; 49237298 PF04947 GO:0006355; GO:0046782; GO:0006351 UniRef100_Q6GZX4 UniRef90_Q6GZX4 UniRef50_Q6GZX4 UPI00003B0FD4 654924 15165820 AY548484 AAT09660.1
UniProtKB accession UniProtKB ID EntrezGene RefSeq NCBI GI number PDB Pfam GO PIRSF IPI UniRef100 UniRef90 UniRef50 UniParc PIR-PSD accession NCBI taxonomy MIM UniGene Ensembl PubMed ID EMBL/GenBank/DDBJ EMBL protein_id
根据文件 idmapping.tb.gz,将 blast 的结果,通过 UniProtKB ID,将第八列的 GO 号注释到对应的基因上,
python UniProt2GO_annotate.py idmapping.tb.gz blastout outputfile
结果如下:
c93619_g2_i1 GO:0005506,GO:0016705,GO:0016021,GO:0004497,GO:0020037
c93619_g2_i3 GO:0009733,GO:0020037,GO:0044550,GO:0016021,GO:0016020,GO:0016711,GO:0009813,GO:0005789,GO:0005506
c70056_g1_i1 GO:0005737,GO:0019722,GO:0071889,GO:0005829,GO:0001077,GO:0006357,GO:0097720,GO:0000978,GO:0046872,GO:0005634,GO:0006874
c93748_g1_i1 GO:0006729,GO:0008124
转载于:https://www.cnblogs.com/shawn2018/p/8667968.html
GO功能注释-简单快速相关推荐
- 插件 | 蛋白序列集合功能注释快速完成 - Quick Protein Anno
写在前面 下游数据分析的时候,大体会遇到以下两个场景: 手工查看基因组任意位置的基因,具体的注释信息,以及其前后基因的功能注释信息 手上有某个序列或者某几个序列,想要快速知道这些序列对应的蛋白到底都有 ...
- WebSocket + Redis简单快速实现Web网站单设备登录功能
1.写在前面的话 生活中,我们在使用一些APP的时候,有过一种体验,就是在A手机上登录账号,因为某些原因需要在B手机上登录,然后就会在A手机上看到类似"该账号在其他设备登录"的提示 ...
- 基因组注释3.基因的功能注释Prokka
基因组注释的前两篇为大家讲解了关于基因组组成成分分析(包括重复序列的识别.非编码基因和编码基因预测等)的内容,今天,将重点介绍如何进行基因的功能注释. 基因的功能注释 获得基因结构信息后,我们希望能够 ...
- go split 正则_WEGO使用—华大基因在线GO功能注释
点击上方「蓝字」关注我们 WEGO是华大基因公司的一个在线GO注释的网站,根据网站的介绍:WEGO(网络基因本体注释图)是一个简单但有用的工具,用于可视化,比较和绘制基因本体注释结果.随着GO词汇越来 ...
- KEGG功能注释工具 KofamKOALA 安装与使用
KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...
- EggNOG功能注释数据库在线和本地使用
文章目录 COG简介 eggNOG简介 eggNOG mapper在线版 eggNOG mapper本地版 安装说明 软件安装 数据库下载 基本使用 HMMER方法 diamond方法 结果解读 高级 ...
- linux下kegg注释软件,KEGG功能注释工具 KofamKOALA 安装与使用
KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...
- pc端html轮播带滑块,swiper.js简单快速实现轮播滑动(兼容PC端、移动端)
swiper是一款免费以及轻量级轮播滑动的js框架,适用于PC端跟移动端,官方地址:(https://www.swiper.com.cn/) 效果演示: PC端 移动端(在浏览器将设备切换为手机,这里 ...
- 简单Android app开发_如何简单快速开发外卖app?
如何开发一个外卖app?app开发需要多少钱?随着美团.饿了么的外卖app的发展,对餐饮.生鲜果蔬.超市便利店行业来说,app成为必不可缺少的一部分.与其向第三方交纳一定不开发一个自己的外卖平台.也有 ...
最新文章
- VTK:可视化算法之FindCellIntersections
- 计算机组成原理 参考,计算机组成原理参考练习
- 技术女性的是是非非(2)
- Nginx开启访问日志记录
- MySQL5.7 服务 crash 后无法启动
- VM在使用过程中开机频繁黑屏(VM14版本问题导致的,频繁开机黑屏)
- eucalyptus 云平台搭建
- 静态链表 ( 数据结构 )
- 阿里云免费ssl证书更换指南2021.4
- python 获取搜狗输入法里面所有的表情图片
- 在数据集Euroc v dataset下跑双目ORB-SLAM2
- 新C++(9):谈谈,翻转那些事儿
- Miktex安装宏包
- 计算机网络——网络工程项目
- Committer 蔡正昕专访:勇敢迈出第一步,做开源没有那么难
- 解决ERROR 1819 (HY000): Your password does not satisfy the current policy requirements
- STM32之震动传感器、继电器介绍及实战
- 《操作系统真象还原》第七章
- html5+css 三列布局
- OCC 中Visual3d_Layer的实现