蛋白质的空间结构是其行使功能的基础,所以蛋白质既有序列数据库还有结构数据库。


蛋白质序列数据库

蛋白质序列数据库有很多,如SwissProt,TrEMBL,Pir等。

Pir是世界上第一个具有分类和功能注释的蛋白质序列数据库。

SwissProt包括了从EMBL翻译而来的蛋白质序列,经过人工校验和注释,冗余度较小。

为了解决人工注释较慢的问题,建立了由计算机注释的TrEMBL数据库,该数据库序列由EMBL中核酸序列翻译而来,其中剔除了包含在SwissProt数据库中的蛋白质序列。

UniProt数据库

整合了SwissProt,TrEMBL,Pir三家数据库的资源构建了通用蛋白质数据库。

UniProt分为三层:

  • UniParc

由于蛋白质序列冗余,将序列相同的合并为一条,为每条序列提供唯一的编号。

  • UniRef

为了加快检索速度,将UniParc中的序列根据一定的条件进行分类并去除冗余。

  • UniProtKB

分为UniRef/TrEMBL和UniRef/SwissProt两部分,为其提供序列的详细信息。


蛋白质结构数据库

蛋白质空间结构

一级:组成蛋白质的氨基酸序列。

二级:由氨基酸序列在空间构成的有规律的结构,一般依靠氢键,疏水键等非共价键维持空间结构,如α螺旋,β折叠。

结构域:介于二级和三级结构之间,蛋白质上的功能区域。

三级:在二级基础上经过进一步弯曲折叠形成的结构。

四级:单体蛋白通过非共价键结合形成的聚合体。

PDB数据库

PDB通过存储原子坐标数据记录蛋白质分子空间结构,数据主要来源是X射线衍射,核磁共振等试验方法所得。

PDB以文本形式存储数据,为了方便查应与结构模型显示软件(RasMol,MBT,JSmol)结合起来以图形方式显示三维结构。

蛋白质结构家族分类数据库

蛋白质结构相比序列在进化上相对更加保守,相同的结构家族同源关系更加可靠,且同一家族功能往往相似,可以进行功能推断。

蛋白质结构家族分类数据库主要由:SCOP,CATH,FSSP。

  • SCOP(人工分类)

  • CATH(半自动分类)


蛋白质组

基因组 转录组 蛋白质组

基因组:构成完整生物体的全部DNA。

转录组:一个基因组表达的全部RNA。

蛋白质组:一个基因组表达的全部蛋白质。

蛋白质组随着时间而变化,并且蛋白质组因为选择性剪切和翻译后修饰等存在,蛋白质组总是多于基因组的基因数目。

生物信息学_分子数据库(三)蛋白质数据库相关推荐

  1. 生物信息学_分子数据库(一)分子数据库概述

    为什么需要分子数据库? 数据库记录包括两部分: 1.原始序列数据 2.描述原始数据的生物学信息的注释 随着研究的积累,生物信息数据越来越多,且在研究中,如果仅仅知道数据的来源 而对其他方面知之甚少,研 ...

  2. 生物信息学_分子数据库(四)其他数据库

    生物数据库除核酸和蛋白质还有一些专用数据库. 当你明确研究对象,应尽可能多的寻找并阅读相关文献. 文献数据库 PubMed数据库 Pubmed是互联网最著名的免费Medline数据库,由NLM的生物信 ...

  3. 常见蛋白质种类_[转载]常用蛋白质数据库

    1.PDB数据库 蛋白质的基本立体结构数据库为PDB (Protein Data Bank),1971年建立于美国布鲁海克海文国家实验室.该数据库中收集了通过X射线衍射和核磁共振(NMR)试验测定的蛋 ...

  4. c access mysql数据库_基于C#的Access MsSQL MySQL 三种数据库访问演示(含源文件Demo)...

    基于C#的Access MsSQL MySQL 三种数据库访问演示(含源文件Demo) 一.三种数据库的主要对比 数据库类型 特点 Microsoft Access 桌面数据库.数据库载体是单个文件 ...

  5. easyui数据表格重置_数据库三种删除方式

    第一种 使用delete 语句 特点: delete 属于数据库操纵语言DML,表示删除表中的数据, 删除过程是每次从表中删除一行,并把该行删除操作作为事务记录在日志中保存 可以配合事件(transa ...

  6. sql 单引号_三种数据库的 SQL 注入详解

    SQL 注入原理 SQL注入攻击指的是通过构建特殊的输入作为参数传入Web应用程序,而这些输入大都是SQL语法里的一些组合,通过执行SQL语句进而执行攻击者所要的操作,其主要原因是程序没有细致地过滤用 ...

  7. 实验三 mysql数据库与表的创建_实验二 数据库和表的创建与管理

    实验二 数据库和表的创建与管理 创建用于企业管理的员工管理数据库,数据库名为YGGL中,YGGL数据库中包括三个表:Employees(员工信息表).Departments(部门信息表).Salary ...

  8. db2 删除索引_数据库三种删除方式

    第一种 使用delete 语句 特点: delete 属于数据库操纵语言DML,表示删除表中的数据, 删除过程是每次从表中删除一行,并把该行删除操作作为事务记录在日志中保存 可以配合事件(transa ...

  9. 使用DB2 pureXML管理蛋白质数据库

    蛋白质数据库( PDB.org )是有关生物分子(主要是蛋白质)的结构数据的全球档案. 蛋白质数据库(PDB)由多个成员组织管理,这些组织负责存放,维护,加工和免费提供此生物学数据给科学界. 为了提供 ...

最新文章

  1. java socket 工具_java+socket 简易聊天工具
  2. SQL Server故障排除圣经
  3. Linux的内存分页管理
  4. VS2005 实用快捷键,迅速提高代码编写效率!
  5. NIO详解(三):IO多路复用模型之select、poll、epoll
  6. Android 超高仿微信图片选择器 图片该这么加载
  7. LNMP单机高并发的简单优化
  8. redis学习——数据类型
  9. Linux修改开机启动logo
  10. python 递归函数与循环的区别_提升Python效率之使用循环机制代替递归函数
  11. oracle移动硬盘盒,oracle-linux下挂载移动硬盘 NTFS类型
  12. delphi acropdf打印多个pdf_将多个PDF文件整合成一个文件
  13. Solr数据库6.3.0版本配置问题:whose UTF8 encoding is longer than the max length 32766
  14. FreeRTOS学习-day01
  15. 每天脑子里莫名其妙冒出来的话(常见于早上起床之后)持续记录,这也是日记的一种
  16. 18位身份证的正则表达式并说明
  17. danlock锁_微信指纹密码锁下载最新版-微信指纹密码(Applock指纹)锁手机版app下载v2.51-单游网...
  18. 原生PHP上传图片并且裁剪图片生成推广海报
  19. python可以实现什么炫酷图形吗_我是Python小玩家,一行代码能做哪些炫酷的事情?...
  20. MacOS Ventura 13.0 Beta5 (22A5321d) 带 OC 0.8.4 三分原版黑苹果镜像

热门文章

  1. 电路保护器件—TVS管
  2. 20145312 《信息安全系统设计基础》期中总结
  3. 网页设计相关计算机语言,网页设计使用的编程语言有哪些?
  4. 使用scrapy.pipelines.images中ImagesPipeline爬取图片
  5. 儿童书写台灯哪个牌子比较好?盘点护眼学生用台灯品牌排行
  6. postman批量自动测试串连接口的一种方式
  7. SdaiBuy 山建大校内购物网开源发布
  8. 【阿里云IoT+YF3300】16.云端一体化,天猫精灵操控YF3300
  9. 二分查找算法的万能公式(LeetCode35、704、1095)
  10. 刚构桥的优缺点_刚构桥特点