我们知道蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性。鉴定一个蛋白中的结构域有助于更深入地理解蛋白功能。其中Pfam是一个大型蛋白结构域家族的数据库,每个蛋白家族都由多个序列比对和HMMs(hidden Markovmodels,隐马尔可夫模型)所体现。那么我们利用Pfam做一些转录因子分类相关的工作呢?下面我以番茄中WOX家族的分类为例做出详尽的解答。

首先我们需要进入Pfam,在搜索栏目上输入WOX,下图输出的结果。Homebox domain明显是WOX所含有的domain,这里我们点开PF00046。

Pfam  wox输出结果

点开PF00046

这里有关于Homebox domain详尽的介绍,如果要继续做分类的话,注意左边上方的Alignment,继续点击。

点开Alignment后

这里需要注意的是,如果下面利用HMMER做分类的话,格式一定要选Stockholm,点击下面Generate,相应的文件即可生成在桌面。

下面将桌面的文件传到服务器,我一般利用SecureCrt的rz命令。

接着我们利用HMMER软件做分类。HMMER被用于在序列数据库中搜索同源序列,产生同源序列比对,所使用的方法是基于隐马尔科夫模型。HMMER常常与profile数据库连用,例如Pfam等。但是HMMER同时能够处理特定的索引,并不仅仅是多序列比对后产生的profile文件,这个与BLAST很像.

1. HMMER的安装

wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz

tar zxf hmmer-3.0.tar.gz

cd hmmer-3.0

./configure

make

make check

2.HMMER使用方法

phmmer: 与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;

> phmmer tutorial/HBB HUMAN uniprot sprot.fa

jackhmmer: 与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;

> jackhmmer tutorial/HBB HUMAN uniprot sprot.fa

hmmbuild: 用多重比对序列构建HMM模型;

hmmsearch: 使用HMM模型搜索序列库;

hmmscan: 使用序列搜索HMM库;

hmmalign: 使用HMM为线索,构建多重比对序列;

> hmmalign globins4.hmm tutorial/globins45.fa

hmmconvert: 转换HMM格式

hmmemit: 从HMM模型中,得到一个模式序列;

hmmfetch: 通过名字或者接受号从HMM库中取回一个HMM模型;

hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;

hmmstat: 显示HMM数据库的统计信息

重要的问题说一遍

注意每个程序都是输出文件在前面,输入文件在后面

hmmbuild (建立参考数据的隐马尔可科夫模型)

hmmbuild hd.hmm hd

输入:多重序列比对的文件(Stockholm file)

输出:建立的这些多重序列比对的隐马尔可科夫模型

hmmsearch(查找)

hmmsearch hd.hmm /datastore1/Shared/ITAG3.2_release/ITAG3.2_proteins.fasta > hd.out

ITAG3.2_proteins.fasta是番茄蛋白的注释文件

more hd.out可得

在阈值0.01之内找到10个蛋白,阈值之外正确率明显下降。找到的蛋白可做进一步分析,验证正确性。

linux下pfam使用方法,利用Pfam数据库的信息做转录因子的分类相关推荐

  1. LINUX 下安装软件方法命令方法

    LINUX 下安装软件方法命令方法 怎么安装应用软件? 我的软件安装在什么地方? 如何删除不要的应用软件? -- 下面,我们就一起来认识一下这些方面的问题. 一. 解析Linux应用软件安装包: 通常 ...

  2. Mysql —— linux下使用c语言访问mySql数据库

    示例1: #include<stdio.h> #include<mysql.h> int main() { MYSQL mysql; mysql_init(&mysql ...

  3. linux下gdb调试方法和技巧详解

    linux下gdb调试方法和技巧整理 简介 UNIX或者UNIX-like下调试工具 启动gdb # 1. 在可执行程序不需要输入参数时,我们可以使用 gdb + 可执行程序 gdb ./typeid ...

  4. linux cpu uuid 查看,Linux下查看UUID方法介绍

    Linux下查看UUID方法介绍. 1. sudo blkid /dev/sda1: UUID="9ADAAB4DDAAB250B" TYPE="ntfs" / ...

  5. Linux下文件加密方法总结

    Linux下文件加密方法总结 为了安全考虑,通常会对一些重要文件进行加密备份或加密保存,下面对linux下的文件加密方法做一简单总结: 方法一:gzexe加密 这种加密方式不是非常保险的方法,但是能够 ...

  6. linux服务器新装hba卡,EmulexHBA卡在Linux下的安装方法

    EmulexHBA卡在Linux下的安装方法 Redhat 9.0+Emulex9002L+lpfc.gcc3.i386.tar 驱动的安装包括了3个部分: 1. 安装驱动程序 2. 编译驱动程序为驱 ...

  7. linux下安装teamviewer方法

    如题:linux下安装teamviewer方法 1:下载teamviewer安装包 2:在终端上进入放teamviewer安装包的目录下 3:执行命令:yum  install  teamviewer ...

  8. linux grep 去重_GPS卫星同步时钟(北斗授时设备)LINUX下配置NTP方法 - NTP校时服务器...

    GPS卫星同步时钟(北斗授时设备)LINUX下配置NTP方法 GPS卫星同步时钟(北斗授时设备)LINUX下配置NTP方法 京准电子科技官微--ahjzsz 第一种方法: 系统使用命令行配置: 在 L ...

  9. crontab的用法 linux,linux下定时执行任务的方法及crontab 用法说明(收集整理)

    linux下定时执行任务的方法 在LINUX中,周期执行的任务一般由cron这个守护进程来处理[ps -ef|grep cron].cron读取一个或多个配置文件,这些配置文件中包含了命令行及其调用时 ...

最新文章

  1. Linux aptget 参数,ubuntu下apt-get 命令参数大全
  2. 哪些模块可用于python性能分析_Python调用C模块以及性能分析
  3. Electric shaver and clean: workable when power is low
  4. 蓝牙mesh网络基础
  5. 最简单的SpringMVC + Maven配置
  6. 解决Android编译so库出错问题
  7. 获取实时股票行情通达信接口
  8. 60个经典励志小故事
  9. 遥感图像通用数据格式(BSQ\BIL\BIP)的理解
  10. JavaScript 基础(一)
  11. 辐射强度和辐射亮度_如何在“辐射4”中隐藏“创意俱乐部新闻”垃圾邮件
  12. java导出多个excel表格,并压缩成zip输出
  13. 宁波跨境海关商品订单推送清关及支付宝海关报关
  14. 动态规划——最长非降子序列
  15. Suspicious.MH690
  16. mysql向上向下递归查询父集子集
  17. 25年IDE进击之路,Visual Studio凭什么?
  18. 路缘石成型机对着项目质量加强的方向努力
  19. windows 7 出现MTP usb设备驱动安装问题解决方法
  20. 大数据时代来临,数据应用随处可见

热门文章

  1. 电竞蓝牙耳机推荐什么牌子好?性价比最高的电竞蓝牙耳机
  2. phpMyAdmin - 数据库导入与导出(Mysql)
  3. 算法的暴力美学之贪心算法
  4. Soot(Java静态分析框架)入门
  5. 百度:地震姜常宏,求传播?!!
  6. 交通大学计算机系95届校友,援藏路风雨兼程 育学子桃李花开——访计算机及其应用专业95届校友毕建权...
  7. 使用奥比中光Orbbec Astra Pro在ROS下跑orb_slam2
  8. 计算机学前教育教案,精品教案:电脑阅读课教案
  9. 程序员取悦女朋友的方式,牛!
  10. 叫树兄的上海行849