一文蛋白功能结构域 预测与分析

1.蛋白结构域分析的原理

生物体的基因组决定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列。蛋白结构域是蛋白中具有特异空间结构和独立功能的区域,是蛋白质发挥生物学效用的关键功能单位。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重要的。

对于所要研究的新基因,如何预测蛋白功能域呢?可以通过以下两种方式:

(1)比较未知蛋白序列与已知蛋白质序列的相似性。

(2)查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。

2.蛋白结构域分析的方法

2.1 CD search

CD-Search基于一个简单的原理:具有相同或相近功能的基因往往具有相同的保守结构域。

CD-Search工具来可以鉴定蛋白质或者核酸序列内的保守结构域或功能单位。该工具位于NCBI中。具体我们可以进入NCBI后选择Conserved Domain然后点击Search

CDD入口:https://www.ncbi.nlm.nih.gov/cdd/,也可以从NCBI主页选项口选择进入Conserved Domain,然后输入蛋白名,点击Search

2.2 Pfam 蛋白结构域数据库

Pfam是一个蛋白家族及 功能域的数据库,而不是蛋白质本身的数据库,这个数据库包括蛋白家族的注释 和由隐马尔科夫模型建立的、具有相同注释结果的所有序列的多序列比对结果。Pfam 与其他蛋白相关的数据库的不同之处在于,它以蛋白质的功能域 或者是蛋白家族作为分类检索的标准。
Pfam 数据库链接:https://pfam.xfam.org/
使用步骤:

(1)在Uniport数据库查询UniProt KB号

点击Uniprot数据库链接https://www.uniprot.org/uniprotkb/,然后输入你所研究的蛋白名,如DNAH1:

在结果页会出现UniProt KB号,也就是E9Q8T7

(2)Pfam 数据库查询结构域:

详细步骤为 点击Pfam 数据库https://pfam.xfam.org/,然后输入UniProt KB号进行查询
如下图:

(3)结果解读与绘制

可以点击和下载蛋白所有的结构域,如下图所示:
绘制可以直接用该结果,或采用PPT形式绘制,也可以用一些绘图软件来完成。

2.3 SMART 蛋白结构域数据库

SMART (Simple Modular Architecture Research Tool) 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步,且人工注释的蛋白结构域超过1300个。

SMART数据库入口:http://smart.embl-heidelberg.de/
检索页面包含如下结果:
(1)结构域可视化:

(2)结构域起始位置和可信度
注:该数据库有以下两种模式 normal 或者 genomic
normal模式下包含了所有uniprot, ensembl的蛋白质信息,这些蛋白序列是存在冗余的,genomic模式下只包含了拥有完整蛋白质组的物种的信息。两种模式可以通过SETUP菜单进行切换,如下图:

(3)蛋白互作信息:

(4)信号通路信息:

2.4 Interpro-蛋白结构域数据库

InterPro是集成的蛋白质结构域和功能位点数据库,包含关于蛋白质家族、域、重复序列、和作用位点等数据资源,同时,InterPro也包含很多来自不同数据库的诊断签名的人工注释文件,形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。
Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库,每两个月更新一次,是非常好用的蛋白序列功能注释数据库。
Interpro数据库链接:http://www.ebi.ac.uk/interpro/
主页如下:

使用方法:
1.点击search,可以选择蛋白质序列、文本-蛋白ID等提交、或结构域
按结构域查找:点击Add Domain to include按钮,填写结构域Pfam ID,即可查询Pfam数据库中含该结构域的蛋白,并且还可以通过点击Add Domain to exclude按钮,添加不包含某结构域条件进行快速筛选。
2.结果查看:
(1)提交任务后会持续运行,直至完成

(2)完成后,会返回结果页面:

会结合多个数据库给出蛋白结构域分析结果:

GO分析:
GO分析显示:该蛋白涉及微管加工过程,具有GTP水解功能,组成细胞骨架功能,是微管的成分,符合预期

3. 蛋白结构域分析的绘制和结果可视化应用

3.1 结果绘制

参考序列起始位点手动绘制,可以自行调整,借助软件来美化

3.2 结果可视化及应用

1.用于标记突变位点对蛋白保守区段的影响

2.用于辅助蛋白互作的研究

3.用于对蛋白功能的探究

一文了解蛋白功能结构域预测与分析相关推荐

  1. 生物工程学蛋白功能预测_海水中生长的工程细菌产生丝蛋白

    生物工程学蛋白功能预测 Can this genetically-modified microbe help the fashion industry go green? 这种转基因微生物可以帮助时尚 ...

  2. 蛋白质结构与功能的预测方法总结和资料汇总

    蛋白质结构与功能的预测方法总结和资料汇总 "折叠(fold)"的概念 "折叠(fold)"是近年来蛋白质研究中应用较广的一个概念,它是介与二级和三级结构之间的蛋 ...

  3. pfamscan 的使用_Pfam数据库蛋白编码能力预测说明

    一.分析背景 蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性.鉴定一个蛋白中的结构域有助于更深入地理解蛋白功能.Pfam是一个大型蛋白结构域家族的 ...

  4. pfamscan 的使用_蛋白编码能力预测软件pfam流程

    原标题:蛋白编码能力预测软件pfam流程 一.分析背景 蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性.鉴定一个蛋白中的结构域有助于更深入地理解蛋 ...

  5. 使用SVM对分泌效应蛋白数据集进行分类预测

    1.SVM简介 支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generaliz ...

  6. 转录因子功能域预测数据库_使用内置转录功能的Microsoft Word节省时间

    转录因子功能域预测数据库 Thanks to a powerful new productivity enhancement, Microsoft 365 subscribers can now tr ...

  7. 没有会员wps合并多个sheet_WPS「合并文档」功能,如何“唰”一下把多个文档合并到一起?...

    在我们的日常工作中,合并多个文档时,多数是将各文档逐一打开.复制.粘贴.关闭等,既麻烦又耗时,还会影响完成进度.那么有没有什么"骚"操作,可以快速高效合并文档?今天就给大家分享如何 ...

  8. wpf中xps文档合并功能实现

    原文:wpf中xps文档合并功能实现 跟着上一篇的xps文档套打的文章,近期一直在研究xps打印技术,其中用户提到了一个需求,要求能够多页面进行打印,我的想法是,先生成xps文件,然后将文件读取出来以 ...

  9. HTML5文档查看器PrizmDoc发布v13.0,新增文档比较功能

    2019独角兽企业重金招聘Python工程师标准>>> PrizmDoc新版本增加了多个功能,可提高文档管理流程的效率,促进更高的生产力. PrizmDoc v13.0中最重要的新功 ...

最新文章

  1. Raspberry Pi 3B 安装NoneBot2
  2. (web前端笔记)2020-12-23(http)
  3. JQuery:多张图片的淡入淡出效果。
  4. Java多线程之volatile详解
  5. eclipse中java.lang.OutOfMemoryError: Java heap space错误
  6. java 0xf0_java 中类似js encodeURIComponent 函数的实现案例
  7. for循环的几种写法(变化)
  8. poj 3181 Dollar Dayz (整数划分问题---递归+DP)
  9. 提高MySQL数据库查询效率的几个技巧(转载)
  10. ip地址怎么设置才有效_如果想减肥,怎么拆解目标才是有效的?
  11. Git基础教程(四)
  12. HW 静态路由实现PC间互通
  13. java 7 update 79下载_java 7下载|java运行环境(JDK 7 Update 67)官方版下载 - 3322软件站
  14. php 1==#039;a1#039;,关于新版本1.9.14.6 加固 dex version 为 039 导致9.0以下无法修复的问题及疑惑。...
  15. 我心目中的编程高手(不得不转)
  16. linux 下载ftp 命令,在Linux命令行中安装及使用FTP客户端的方法
  17. s905l android5,魔百盒CM201-1-YS-S905L纯净安卓系统固件包
  18. matlab求非线性方程的根,求非线性方程的根
  19. HTML单选、多选、按钮、下拉框、文本输入框
  20. 图像矫正:桶形畸变矫正的原理及python简易实现与加速

热门文章

  1. -2147483648 < 2147483647,为什么有的编译器运行结果为false?
  2. 初入SAS后的一些小技巧
  3. 扫盲:SSL是如何工作的?【转】
  4. C/C++陷阱与套路
  5. var _ HelloServiceInterface = (*HelloServiceClient)(nil)的特殊含义
  6. 老牌基金重仓股轮番遭“空投”
  7. Jenkins报Failed to remove prefix from file named
  8. mfc odbc mysql数据库_MFC- Mysql数据库连接-ODBC
  9. 微软Windows Phone卷土归来
  10. 无孔不入的广告,亦是恶龙的化身