使用Clustal进行多序列比对
欢迎关注”生信修炼手册”!
多序列比对在保守区域鉴定,系统发育分析,motif识别等多个领域发挥重要作用,是生物信息数据分析必备的基础技能之一。Clustal是一款经典的多序列比对工具,支持DNA, RNA, 蛋白质的比对。官网如下
http://www.clustal.org/
clustal 有两个版本可用,之前的版本同时提供了GUI和命令行两种工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。
最新本的omega比对准确度更高,而且速度更快,适合几千条规模的多序列比对,该软件目前只提供了命令行版本。在官网上,提供了源代码和编译好的二进制文件
通常情况下,直接下载对应的二进制可执行文件就行了。软件的基本用法如下:
clustalo -i seq.fasta > align.fa
-i
指定输入的序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件中。该软件支持多种格式的输出
fasta
clustal
msf
phylip
selex
stockholm
vienna
默认输出格式为fasta
, 可以通过--outfmt
参数指定输出文件的格式。多序列比对不同于Blast的地方在于,Blast是局部比对,而多序列比对是全局比对。全局比对意味着需要将输入序列对齐到同一个水平来比对,一般是通过在输入序列中插入碱基的方式来使序列对齐,示意如下
>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin
ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG
CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC
CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG
CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC
CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA
CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT
GACCTCCAAATACCGTTAA
>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin
ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG
TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC
CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC
CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA
CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT
CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT
GACCTCCAAGTACCGTTAA
>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin
ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG
CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA
GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA
GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT
GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA
CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT
CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT
CTCTGAGAAGTACCGCTAA
通过在序列中插入-
来使得序列对齐。如果不习惯命令行的操作方式,也有在线服务可以使用。EBI提供的在线服务网址如下
https://www.ebi.ac.uk/Tools/msa/clustalo/
使用非常简单,输入序列,调整参数设置,然后提交即可。在输出结果中,还提供了颜色标记,进化树可视化等功能。
通过Mview
可视化多序列比对结果,示意如下
也支持导出到Jalview
软件中进行可视化。
通过Phylogenetic Tree
可以查看进化树的结果,默认采用NJ法建树,示意如下
也可以通过Send to Simple Phylogeny, 创建进化树,支持NJ和UPGMA两种建树方式。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
使用Clustal进行多序列比对相关推荐
- clustalw序列比对_如何做出漂亮的序列比对图——ENDscript/ESPript
以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 如何做出漂亮的序列比对图--ENDscript/ESPript 大家经常在文献中看到非常好看的序列比对图,现在笔者将目前见过的最好看的 ...
- 如何做出漂亮的序列比对图——ENDscript/ESPript
以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 四川魔德科技有限公司(www.modekeji.cn),专业从事分子模拟,量子化学等计算服务,欢迎咨询! 大家经常在文献中看到非常好看 ...
- 生物信息学(4)——多序列比对之CLUSTAL算法详解及C++实现
生物信息学系列博客索引 生物信息学(1)--双序列比对之Needleman-Wunsch(NW)算法详解及C++实现 生物信息学(2)--双序列比对之Smith-Waterman(SW)算法详解 生物 ...
- 生信自学笔记(九)智慧的长者与多序列联配之clustal全局联配算法
要不,还是先讲个黑暗的小故事吧. 国王愈来愈烦躁了,他觉得这个国家满哪儿都是人,大街上走着人,池塘里泡着人,屋顶上晾着人,自己去四下巡游,什么风景都看不着. "这可不行,这么多人,东西哪够分 ...
- 多重比对序列的格式及其应用
这里对多重序列比对格式(Multiple sequence alignment – MSA)进行总结.在做系统演化分析.序列功能分析.基因预测等,都需要涉及到多重序列比对.特别是当需要用不同软件对多重 ...
- 高通量测序技术和序列拼接算法探析
高通量测序技术和序列拼接算法探析 时间:2019-05-27 来源:计算机科学 作者:周卫星,石海鹤 本文字数:16853字 摘 要: 高通量测序 (High-throughput Sequen ...
- 多序列比对的c语言程序,多序列比对的实际应用
Andreas D.Baxevanis Genome Technology Branch National Human Genome Research Institude National Insti ...
- clustalw序列比对_序列比对(二)
Homology is the central concept for all of biology.--David Wake. Science, 1994 前言 正如前面引用的这句话,同源性是生物学 ...
- php时间序列比对,常用在线序列比对工具
从早期序列比对工具Needleman-Wunsch.Smith-Waterman到后来的Clustal算法,以及近几年的Muscle.MAFFT序列比对算法.算法在向更快.更精确.能处理更多数据这些方 ...
- 【生信MOOC】生物序列比对工具——多序列比对
[生信MOOC]生物序列比对工具2--多序列比对 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信MOOC]生物序列比对工具2--多序列比对 1 ...
最新文章
- java客服系统_阿里Java内部资料:2020最全Java技术栈(架构篇+算法篇+大数据)
- Java集合类解析 ***
- abb外部轴零位校准_ABB机器人如何控制非同步联动外部轴
- 几种流行的AJAX框架:jQuery,Mootools,Dojo,Ext JS的对比
- matlab神经网络每次相差大,GA-BP网络为什么每次训练的结果相差很大呢?
- 配置isc-dhcrelay需要注意的事项
- 关系型数据库全表扫描分片详解
- cnn 一维时序数据_蚂蚁集团智能监控的时序异常检测:基于 CNN 神经网络的异常检测...
- apt ubuntu 指定ipv4_macOS 下使用 Docker 搭建 ubuntu 环境
- 如何删除 EMC存储认到的鬼盘LUNZ disk,在存储上出现initiators storage group ~management的情况...
- bitmap存入mysql,[MySQL] mysql中bitmap的简单运用
- STM32 外部中断
- Python游戏篇:细节之大型游戏爆炸效果(附代码)
- 上传pdf图片 文件
- Weiss-(DSAA - in C,1.3)字谜游戏
- 北京的互联网公司有哪些?
- 医学图像预处理(五) 器官与病灶的直方图
- Panda3D如何加载obj格式的3D模型文件
- 巴菲特弃用 20 美元的三星翻盖,换上了 iPhone
- Debian的BIND9的配置
热门文章
- python编辑器怎么放大字体_增大python字体的方法步骤
- Python 九九乘法表打印
- 众泰Z700导航升级高德地图
- 《大数据之路:阿里巴巴大数据实践》-第3篇 数据管理篇 -第14章 存储和成本管理
- oracle创建存储过程报错,oracle创建了存储过程,在PLSQL @路径 执行后报错
- 计算机系科学与技术调研报告,计算机科学与技术专业认识实习调研报告
- JavaScript 设计模式核核心原理与应⽤实践(一)原则于核心思想
- java批量提交事务_java加事务批量提交
- 为什么HierachyViewer无法连接真机调试
- 【学习笔记】Servlet容器(Web容器)简介