参考:https://www.cnblogs.com/xiaojikuaipao/p/7190779.html   https://blog.csdn.net/ygyxl/article/details/79742751

GO 注释主要有两种方法:序列相似性比对(BLAST)和结构域相似性比对(InterProScan)

1. 将基因序列与 swiss-prot 蛋白质数据库进行 BLAST 比对,得到如下结果:

c00_g1_i1       RNF13_MOUSE     52.00   50      23      1       17      166     240     288     2e-11   65.5

c01_g1_i1       RS25_NEUCR      78.72   94      20      0       375     94      1       94      1e-32   116

其中,第二列为 swiss-prot 蛋白质数据库序列的 ID(UniProtKB ID)。

2. 注释

从 ftp://ftp.pir.georgetown.edu/databases/idmapping 下载 idmapping.tb.gz,该文件共有 22 列(tab 键分割),如:

Q6GZX4    001R_FRG3G  2947773  YP_031579.1  81941549; 49237298  PF04947  GO:0006355; GO:0046782; GO:0006351  UniRef100_Q6GZX4  UniRef90_Q6GZX4 UniRef50_Q6GZX4 UPI00003B0FD4   654924   15165820    AY548484    AAT09660.1

UniProtKB accession UniProtKB ID EntrezGene RefSeq NCBI GI number PDB Pfam GO PIRSF IPI UniRef100 UniRef90 UniRef50 UniParc PIR-PSD accession NCBI taxonomy MIM UniGene Ensembl PubMed ID EMBL/GenBank/DDBJ EMBL protein_id

根据文件 idmapping.tb.gz,将 blast 的结果,通过 UniProtKB ID,将第八列的 GO 号注释到对应的基因上,

python UniProt2GO_annotate.py idmapping.tb.gz blastout outputfile

结果如下:

c93619_g2_i1 GO:0005506,GO:0016705,GO:0016021,GO:0004497,GO:0020037

c93619_g2_i3 GO:0009733,GO:0020037,GO:0044550,GO:0016021,GO:0016020,GO:0016711,GO:0009813,GO:0005789,GO:0005506

c70056_g1_i1 GO:0005737,GO:0019722,GO:0071889,GO:0005829,GO:0001077,GO:0006357,GO:0097720,GO:0000978,GO:0046872,GO:0005634,GO:0006874

c93748_g1_i1 GO:0006729,GO:0008124

转载于:https://www.cnblogs.com/shawn2018/p/8667968.html

GO功能注释-简单快速相关推荐

  1. 插件 | 蛋白序列集合功能注释快速完成 - Quick Protein Anno

    写在前面 下游数据分析的时候,大体会遇到以下两个场景: 手工查看基因组任意位置的基因,具体的注释信息,以及其前后基因的功能注释信息 手上有某个序列或者某几个序列,想要快速知道这些序列对应的蛋白到底都有 ...

  2. WebSocket + Redis简单快速实现Web网站单设备登录功能

    1.写在前面的话 生活中,我们在使用一些APP的时候,有过一种体验,就是在A手机上登录账号,因为某些原因需要在B手机上登录,然后就会在A手机上看到类似"该账号在其他设备登录"的提示 ...

  3. 基因组注释3.基因的功能注释Prokka

    基因组注释的前两篇为大家讲解了关于基因组组成成分分析(包括重复序列的识别.非编码基因和编码基因预测等)的内容,今天,将重点介绍如何进行基因的功能注释. 基因的功能注释 获得基因结构信息后,我们希望能够 ...

  4. go split 正则_WEGO使用—华大基因在线GO功能注释

    点击上方「蓝字」关注我们 WEGO是华大基因公司的一个在线GO注释的网站,根据网站的介绍:WEGO(网络基因本体注释图)是一个简单但有用的工具,用于可视化,比较和绘制基因本体注释结果.随着GO词汇越来 ...

  5. KEGG功能注释工具 KofamKOALA 安装与使用

    KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...

  6. EggNOG功能注释数据库在线和本地使用

    文章目录 COG简介 eggNOG简介 eggNOG mapper在线版 eggNOG mapper本地版 安装说明 软件安装 数据库下载 基本使用 HMMER方法 diamond方法 结果解读 高级 ...

  7. linux下kegg注释软件,KEGG功能注释工具 KofamKOALA 安装与使用

    KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...

  8. pc端html轮播带滑块,swiper.js简单快速实现轮播滑动(兼容PC端、移动端)

    swiper是一款免费以及轻量级轮播滑动的js框架,适用于PC端跟移动端,官方地址:(https://www.swiper.com.cn/) 效果演示: PC端 移动端(在浏览器将设备切换为手机,这里 ...

  9. 简单Android app开发_如何简单快速开发外卖app?

    如何开发一个外卖app?app开发需要多少钱?随着美团.饿了么的外卖app的发展,对餐饮.生鲜果蔬.超市便利店行业来说,app成为必不可缺少的一部分.与其向第三方交纳一定不开发一个自己的外卖平台.也有 ...

最新文章

  1. VTK:可视化算法之FindCellIntersections
  2. 计算机组成原理 参考,计算机组成原理参考练习
  3. 技术女性的是是非非(2)
  4. Nginx开启访问日志记录
  5. MySQL5.7 服务 crash 后无法启动
  6. VM在使用过程中开机频繁黑屏(VM14版本问题导致的,频繁开机黑屏)
  7. eucalyptus 云平台搭建
  8. 静态链表 ( 数据结构 )
  9. 阿里云免费ssl证书更换指南2021.4
  10. python 获取搜狗输入法里面所有的表情图片
  11. 在数据集Euroc v dataset下跑双目ORB-SLAM2
  12. 新C++(9):谈谈,翻转那些事儿
  13. Miktex安装宏包
  14. 计算机网络——网络工程项目
  15. Committer 蔡正昕专访:勇敢迈出第一步,做开源没有那么难
  16. 解决ERROR 1819 (HY000): Your password does not satisfy the current policy requirements
  17. STM32之震动传感器、继电器介绍及实战
  18. 《操作系统真象还原》第七章
  19. html5+css 三列布局
  20. OCC 中Visual3d_Layer的实现

热门文章

  1. SpringBoot 打包为war包启动时导入外部配置文件
  2. Linux配置双网卡--静态路由
  3. Python高新入职全面试题
  4. 如何根据接口文档,写一个接口类(举例说明)
  5. HRNet 论文阅读笔记
  6. mptcp linux 升级,Ubuntu12.10编译MPTCP
  7. mptcp协议参数解析
  8. linux-mptcp调度算法,MPTCP的轮询调度算法
  9. 永远年轻的人---阿诺德·施瓦辛格
  10. 背景图片自适应功能 | 小程序