欢迎关注”生信修炼手册”!

多序列比对在保守区域鉴定,系统发育分析,motif识别等多个领域发挥重要作用,是生物信息数据分析必备的基础技能之一。Clustal是一款经典的多序列比对工具,支持DNA, RNA, 蛋白质的比对。官网如下

http://www.clustal.org/

clustal 有两个版本可用,之前的版本同时提供了GUI和命令行两种工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。

最新本的omega比对准确度更高,而且速度更快,适合几千条规模的多序列比对,该软件目前只提供了命令行版本。在官网上,提供了源代码和编译好的二进制文件

通常情况下,直接下载对应的二进制可执行文件就行了。软件的基本用法如下:

clustalo -i seq.fasta > align.fa

-i指定输入的序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件中。该软件支持多种格式的输出

  1. fasta

  2. clustal

  3. msf

  4. phylip

  5. selex

  6. stockholm

  7. vienna

默认输出格式为fasta, 可以通过--outfmt参数指定输出文件的格式。多序列比对不同于Blast的地方在于,Blast是局部比对,而多序列比对是全局比对。全局比对意味着需要将输入序列对齐到同一个水平来比对,一般是通过在输入序列中插入碱基的方式来使序列对齐,示意如下

>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin
ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG
CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC
CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG
CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC
CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA
CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT
GACCTCCAAATACCGTTAA
>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin
ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG
TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC
CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC
CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA
CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT
CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT
GACCTCCAAGTACCGTTAA
>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin
ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG
CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA
GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA
GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT
GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA
CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT
CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT
CTCTGAGAAGTACCGCTAA

通过在序列中插入-来使得序列对齐。如果不习惯命令行的操作方式,也有在线服务可以使用。EBI提供的在线服务网址如下

https://www.ebi.ac.uk/Tools/msa/clustalo/

使用非常简单,输入序列,调整参数设置,然后提交即可。在输出结果中,还提供了颜色标记,进化树可视化等功能。

通过Mview可视化多序列比对结果,示意如下

也支持导出到Jalview软件中进行可视化。

通过Phylogenetic Tree可以查看进化树的结果,默认采用NJ法建树,示意如下

也可以通过Send to Simple Phylogeny, 创建进化树,支持NJ和UPGMA两种建树方式。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

使用Clustal进行多序列比对相关推荐

  1. clustalw序列比对_如何做出漂亮的序列比对图——ENDscript/ESPript

    以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 如何做出漂亮的序列比对图--ENDscript/ESPript 大家经常在文献中看到非常好看的序列比对图,现在笔者将目前见过的最好看的 ...

  2. 如何做出漂亮的序列比对图——ENDscript/ESPript

    以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正! 四川魔德科技有限公司(www.modekeji.cn),专业从事分子模拟,量子化学等计算服务,欢迎咨询! 大家经常在文献中看到非常好看 ...

  3. 生物信息学(4)——多序列比对之CLUSTAL算法详解及C++实现

    生物信息学系列博客索引 生物信息学(1)--双序列比对之Needleman-Wunsch(NW)算法详解及C++实现 生物信息学(2)--双序列比对之Smith-Waterman(SW)算法详解 生物 ...

  4. 生信自学笔记(九)智慧的长者与多序列联配之clustal全局联配算法

    要不,还是先讲个黑暗的小故事吧. 国王愈来愈烦躁了,他觉得这个国家满哪儿都是人,大街上走着人,池塘里泡着人,屋顶上晾着人,自己去四下巡游,什么风景都看不着. "这可不行,这么多人,东西哪够分 ...

  5. 多重比对序列的格式及其应用

    这里对多重序列比对格式(Multiple sequence alignment – MSA)进行总结.在做系统演化分析.序列功能分析.基因预测等,都需要涉及到多重序列比对.特别是当需要用不同软件对多重 ...

  6. 高通量测序技术和序列拼接算法探析

    高通量测序技术和序列拼接算法探析 时间:2019-05-27 来源:计算机科学 作者:周卫星,石海鹤 本文字数:16853字 摘    要: 高通量测序 (High-throughput Sequen ...

  7. 多序列比对的c语言程序,多序列比对的实际应用

    Andreas D.Baxevanis Genome Technology Branch National Human Genome Research Institude National Insti ...

  8. clustalw序列比对_序列比对(二)

    Homology is the central concept for all of biology.--David Wake. Science, 1994 前言 正如前面引用的这句话,同源性是生物学 ...

  9. php时间序列比对,常用在线序列比对工具

    从早期序列比对工具Needleman-Wunsch.Smith-Waterman到后来的Clustal算法,以及近几年的Muscle.MAFFT序列比对算法.算法在向更快.更精确.能处理更多数据这些方 ...

  10. 【生信MOOC】生物序列比对工具——多序列比对

    [生信MOOC]生物序列比对工具2--多序列比对 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信MOOC]生物序列比对工具2--多序列比对 1 ...

最新文章

  1. java客服系统_阿里Java内部资料:2020最全Java技术栈(架构篇+算法篇+大数据)
  2. Java集合类解析 ***
  3. abb外部轴零位校准_ABB机器人如何控制非同步联动外部轴
  4. 几种流行的AJAX框架:jQuery,Mootools,Dojo,Ext JS的对比
  5. matlab神经网络每次相差大,GA-BP网络为什么每次训练的结果相差很大呢?
  6. 配置isc-dhcrelay需要注意的事项
  7. 关系型数据库全表扫描分片详解
  8. cnn 一维时序数据_蚂蚁集团智能监控的时序异常检测:基于 CNN 神经网络的异常检测...
  9. apt ubuntu 指定ipv4_macOS 下使用 Docker 搭建 ubuntu 环境
  10. 如何删除 EMC存储认到的鬼盘LUNZ disk,在存储上出现initiators storage group ~management的情况...
  11. bitmap存入mysql,[MySQL] mysql中bitmap的简单运用
  12. STM32 外部中断
  13. Python游戏篇:细节之大型游戏爆炸效果(附代码)
  14. 上传pdf图片 文件
  15. Weiss-(DSAA - in C,1.3)字谜游戏
  16. 北京的互联网公司有哪些?
  17. 医学图像预处理(五) 器官与病灶的直方图
  18. Panda3D如何加载obj格式的3D模型文件
  19. 巴菲特弃用 20 美元的三星翻盖,换上了 iPhone
  20. Debian的BIND9的配置

热门文章

  1. python编辑器怎么放大字体_增大python字体的方法步骤
  2. Python 九九乘法表打印
  3. 众泰Z700导航升级高德地图
  4. 《大数据之路:阿里巴巴大数据实践》-第3篇 数据管理篇 -第14章 存储和成本管理
  5. oracle创建存储过程报错,oracle创建了存储过程,在PLSQL @路径 执行后报错
  6. 计算机系科学与技术调研报告,计算机科学与技术专业认识实习调研报告
  7. JavaScript 设计模式核核心原理与应⽤实践(一)原则于核心思想
  8. java批量提交事务_java加事务批量提交
  9. 为什么HierachyViewer无法连接真机调试
  10. 【学习笔记】Servlet容器(Web容器)简介