Linux下安装Psi-Blast,HHblits和MUFoldSS,用于预测蛋白质二级结构
0. 简介:
MUFoldSS是预测蛋白质二级结构的软件,但是序列的长度要 <= 700。
详情见文献:Fang, Chao, Yi Shang, and Dong Xu. MUFold-SS: New deep inception-inside-inception networks for protein secondary structure prediction. PROTEINS: Structure, Function, and Bioinformatics 86, no. 5 (2018): 592-598.
Psi-Blast:序列比对,寻找蛋白质的远亲,比Protein Blast在寻找遥远的进化关系方面更加敏感。
详情见Blast官网:https://blast.ncbi.nlm.nih.gov/Blast.cgi
HHblits:一种新的序列搜寻方法用于鉴别数据库中相似序列的蛋白。
详情见文献:Remmert, Michael et al. “HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment.” Nature methods vol. 9,2 173-5. 25 Dec. 2011, doi:10.1038/nmeth.1818
需要注意的是:
该软件的输入有3个:序列fasta文件,Psi-Blast的pssm文件和HHblits的hhm文件。因而下面先介绍Psi-Blast和HHblits软件的安装与运行,再介绍MUFoldSS的安装与运行。
1. Psi-Blast
1.1 下载:
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
1.2 安装:
解压:tar -zxvf ncbi-blast-2.13.0+-x64-linux.tar.gz
1.3 运行:
切换到bin/
目录下,直接运行./psiblast -h
查看帮助文档
1.4 备注:
具体到本实验中,先构建库文件(将待建库的文件放到一个fasta文件中(以lib.fasta
为例,同时假定也在bin/
目录下,或者指定lib.fasta
所在位置),在bin/
目录下:./makeblastdb -in lib.fasta -parse_seqids -hash_index -dbtype prot
);
建库完成之后,bin/
目录下运行./psiblast -query text.fasta -db lib.fasta -num_iterations 3 -evalue 0.001 -out_ascii_pssm outfile.pssm
参数解释:-query text.fasta
是用于比对的序列文件;-db lib.fasta
是用于比对的库文件;-num_iterations 3
表示迭代三次;-out_ascii_pssm outfile.pssm
表示输出文件为pssm
格式,文件名称为outfile.pssm
;
2. HHblits
2.1下载及安装:
直接参考github上的安装教程即可:https://github.com/soedinglab/hh-suite
所需的库文件 (如下图所示,任选其一):
2.2 运行命令:
hhblits -i <input-file> -ohhm <result-file> -n 1 -d <database-basename>
参数说明:-i
输入文件;-ohhm
输出hmm
格式的文件;-n
迭代次数,默认是2;-d
数据库名称。详情见./hhblits --help
3. MUFoldSS
3.1 下载:
从 http://dslsrv8.cs.missouri.edu/~cf797/MUFoldSS/download.html 下载所需的版本,此处以3.0为例。
注意:目前(2022-12-09)上述链接已失效,所以我将之前下载的源码放在了这里:https://download.csdn.net/download/weixin_44065416/87260198?spm=1001.2014.3001.5503
(如要白嫖,请评论区留邮箱)。
3.2 安装:
下载完解压即可 tar -zxvf StandAlone_withProfiles.tar.gz
3.3 运行:
解压完成之后StandAlone_withProfiles/
目录下有一个runMUFOLDSS_WithProfiles
文件,如果要用该文件运行程序的话,需要将execdir
和datadir
的路径改为自己当前的安装路径 (PS:因为runMUFOLDSS_WithProfiles
使用Shell写的,我看不太懂,所以就自己用python重新写了一个名为runMUFoldSS.py
的运行脚本,如下)。
import os
import sys
import timefasta_file = sys.argv[1] ## 输入蛋白序列的 fasta文件 ()
pro_file = sys.argv[2] ## 输入第一步 Psi-Blast 得到的 .pssm 文件
hhm_file = sys.argv[3] ## 输入第二步 hhblits 得到的 .hmm 文件
model_file = 'data/model.h5' ## 模型文件,在 data/ 目录下
outfile = sys.argv[4] ## 输出文件print('Start: %s' % time.asctime(time.localtime(time.time())))
command_line = 'python bin/executable_withHHBlits.py -s '+fasta_file+' -p '+pro_file+' -m '+hhm_file+' -w '+model_file+' > '+outfile
os.system(command_line)
print('End: %s' % time.asctime(time.localtime(time.time())))
上述脚本运行方法:python runMUFOLDSS_WithProfiles.py prot.fasta prot.pssm prot.hmm outfile.txt
Linux下安装Psi-Blast,HHblits和MUFoldSS,用于预测蛋白质二级结构相关推荐
- linux下安装sbt_如何在Linux上安装SBT
linux下安装sbt 介绍 (Introduction) Hi! I am Sanjula, and in this guide I hope to teach you how to install ...
- Linux下安装Oracle参数自动初始化脚本
在linux下安装Oracle通常是一件很头疼的事情, 而如果我们只是为了部署CMS的话,也没有必要对Oracle的参数去做详细的了解. 那么有没有办法简化这个安装过程呢? 下面给出了一个在Linux ...
- Linux下安装和使用boost库
Linux下安装和使用boost库 2016-08-26 20:29:06 zhaomax 阅读数 349更多 分类专栏: C++ 用boost库中的serialization库.Boost库分为两个 ...
- SIPp工具Linux下安装
2019独角兽企业重金招聘Python工程师标准>>> 一.SIPp介绍 SIPp是一个测试SIP协议性能的工具软件,这是一个开源软件. 它可使用INVITE和B YE建立 ...
- Linux下安装rabbitmq3.7.8
Linux下安装rabbitmq 1.安装Erlang环境 1)安装GCC GCC-C++ Openssl等模块 2)安装ncurses 3)安装erlang环境 4)配置安装 5)验证是否安装成功 ...
- 如何在Linux下安装Docker
如何在Linux下安装Docker Docker概念: Docker包括三个基本概念: l 镜像(Image) l 容器(Container) l 仓库(Repository) 理解了这三个概念 ...
- 如何在Linux下安装MySQL8.0
如何在Linux下安装MySQL8.0 准备工作: mysql8.0 rpm文件 测试工具(比如 idea的database工具) 安装步骤: 1. 下载mysql的repo源,下载地址:ht ...
- Linux下安装Weblogic10.3.6并创建简单集群测试
Linux下安装Weblogic10.3.6并创建简单集群进行测试 一.卸载随系统安装的openjdk 1.先查看安装的jdk信息,常用命令有rpm -qa | grep java, rpm -qa ...
- Linux下安装、配置PHP环境
Linux下安装.启动MySQL :http://blog.csdn.net/wy3552128/article/details/8143686 Linux下安装.配置.启动Apache:http:/ ...
最新文章
- 微信公众平台开发(82) 天气预报
- java SSM多操作注解回滚
- 【2】青龙面板入门系列教程之宝塔面板的安装以及docker的安装
- Ubuntu 16.04 安装 ROS
- 在SAP CRM呼叫中心的搜索结果点击Edit按钮后的处理逻辑
- php time()为空_PHP time()用法及代码示例
- 老司机实战Windows Server Docker:3 单节点Windows Docker服务器简单运维(上)
- 电路 第五版 第三章电阻电路的一般分析
- Excel 批量处理行高(图文教程) - Excel篇
- 中国铁路官宣:高铁Wi-Fi将融合5G技术
- html两行中间间距怎么去,css行之间的间距怎么调?
- 计算机专业挂职锻炼,计算机学院挂职体验谈
- ctrl z撤销后如何恢复_偏瘫后如何恢复?偏瘫家庭功能锻炼方法送给你
- RK3128功能介绍
- Excel学习 -- 函数基础
- python爬取大众点评数据_爬虫爬取大众点评评论数
- 杭州电子科技大学考研计算机科学与技术,杭州电子科技大学考研好考吗
- 大学必备C语言基础知识(一)
- Elasticsearch _reindex Alias使用
- 校招社招互联网面试经验总结
热门文章
- GPS及AGPS定位基本原理解析
- fatal error C1189: #error : WRL requires NTDDI_VERSION to be #defined at least
- 10、zuul 网关配置
- 专项职业能力考核计算机,专项职业能力考核项目指定试题汇编教材用书表(信息技术类)...
- 2023年,大型数据中心PUE将降到1.3以下...
- 服务器虚拟化pue,降低数据中心PUE的八个办法
- 关于 NFT 你想知道的一切都在这里
- 张益唐111页零点猜想论文出炉!自称比孪生素数猜想意义更大,每天思考12小时被太太骂...
- rabbitMQ在linux上安装教程和问题解决
- SpringBoot后端生成漂亮美观的验证码图片