常见的建树方法有:贝叶斯法(Bayesian),最大似然法(Maximum likelihood,ML),最大简约法(Maximum parsimony,MP),邻接法(Neighbor-Joining,NJ),最小进化法(Minimum Evolution,ME),类平均法(UPGMA)。

一般来讲,如果模型合适,最大似然法的效果较好。对于近缘序列,最大简约法用的假设最少,各种方法结果相似。而对于远缘序列,一般使用最大似然法或邻接法。对相似度很低的序列,邻接法往往出现 Long-branch attraction(LBA,长枝吸引现象),严重干扰进化树的构建。对于各种方法构建分子进化树的准确性,Hall 认为贝叶斯的方法最好,其次是最大似然法,然后是最大简约法。其实如果序列的相似性较高,各种方法结果差别不大。

最大似然法和邻接法需要选择模型。对于蛋白质序列,一般选择 Poisson Correction(泊松修正)模型。而对于核酸序列,一般选择 Kimura 2-parameter(Kimura-2 参数)模型。

表 1. 构建进化树的常用软件

软件名称简介

Clustal X图形化的序列比对工具

GeneDoc多序列比对结果美化工具

BioEdit序列分析综合工具

MEGA图形化比对,进化分析综合工具

PAUP进化分析工具

Phylip进化分析工具

PhyML最大似然法建树工具

PAML最大似然法建树工具

MrBayes贝叶斯法建树工具

FastTree最大似然法建树工具(速度快)

TreeView进化树显示工具

本文主要讲 FastTree 使用方法:

首先介绍几点特性:

1. 在默认参数下,FastTree 比 PhyML 更准确,比 PhyML 快 100~1000 倍;

2.FastTree 使用模型为:核酸进化模型:Jukes-Cantor 或者 GTR(generalized time-reversible);蛋白进化模型:JTT (Jones-Taylor-Thornton 1992), WAG (Whelan & Goldman 2001) 或者 LG (Le and Gascuel 2008)

下载,安装 FastTree

FastTree 提供以下几个版本:

Linux 64-bit executable (+SSE)

Multi-threaded executable (+SSE +OpenMP) (see usage guide)

Windows 32-bit command-line executable (no SSE)

C code

下载 Windows 32-bit command-line executable (no SSE) 后,是一个 FastTree.exe 文件,可以直接在 cmd 命令行程序中调用运行。

新建一个文件夹:比如在 D 盘目录下新建一个 FastTree 文件夹,将 FastTree.exe 程序放在 D:FastTree 目录下。

FastTree 运行(Windows 为例)

开始菜单—搜索—cmd

切换目录到 D:FastTree

最大似然树构建:FastTree protein alignment file > tree

在目录 D:FastTree 生成.tree 文件,可以使用 TreeView 或 MEGA 打开。

构建进化树时,可以选择不同的模型:

命令行:D:FastTree>FastTree -lg CIPK.phy >CIPK.tree

alignment file 格式

alignment file 格式如上图。

可以首先使用 Clustal X 比对序列:Alignment—Output Format Options—Phylip format

比对后,在比对目录下生成几个文件,其中.phy 后缀名文件是 FastTree 要使用的。

参考文献:

Hall B G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences[J]. Molecular Biology and Evolution, 2005, 22(3): 792-802.

Price, M.N., Dehal, P.S., and Arkin, A.P. (2009) FastTree: Computing Large Minimum-Evolution Trees with Profiles instead of a Distance Matrix. Molecular Biology and Evolution 26:1641-1650.

Price, M.N., Dehal, P.S., and Arkin, A.P. (2010) FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490.

Jones D T, Taylor W R, Thornton J M. The rapid generation of mutation data matrices from protein sequences[J]. Computer applications in the biosciences: CABIOS, 1992, 8(3): 275-282.

Whelan S, Goldman N. A general empirical model of protein evolution derived from multiple protein families using a maximum-likelihood approach[J]. Molecular biology and evolution, 2001, 18(5): 691-699.

Le S Q, Gascuel O. An improved general amino acid replacement matrix[J]. Molecular biology and evolution, 2008, 25(7): 1307-1320.

作者:muminwangzi

linux系统发育树的构建步骤,手把手教你用 Fast Tree 快速构建序列进化树相关推荐

  1. 今晚直播 | 谷歌资深工程师手把手教你使用TensorFlow最新API构建学习模型

    目前,深度学习的研究和应用大受追捧,各种开源的深度学习框架层出不穷.TensorFlow 作为目前最受欢迎的深度学习框架,已经在 GitHub 上获得了 112194 个 star,受欢迎程序可见一斑 ...

  2. linux wait函数头文件_手把手教Linux驱动9-等待队列waitq

    在上一篇<手把手教Linux驱动8-Linux IO模型>我们已经了解了阻塞.非阻塞.同步和异步等相关概念,本文主要讲解如何通过等待队列实现对进程的阻塞. 应用场景: 当进程要获取某些资源 ...

  3. linux刻录win10u盘_手把手教你装系统之【制作官方win10安装U盘】

    本帖最后由 蚂蚁炒花甲 于 2019-11-11 22:58 编辑 很多粉粉在收到linux版本的笔记本后 用不惯,但又不知道如何装win10系统 下面我就来教大家,如何自己动手 制作win10 安装 ...

  4. 手把手教你用FineBI,快速搭建可视化驾驶舱

    相信大家最近都看过许多关于管理驾驶舱的文章,有些驾驶舱数据分析页面确实是狂拽炫酷得不行,但是对于这些页面具体的制作过程,怎么样最佳展现数据的业务价值,想必大家还是有些云里雾里. 本篇文章以销售管理驾驶 ...

  5. 手机照片怎么做成视频?手把手教你,3步快速完成动感效果

    现在出行用手机拍照是最方便不过的了,但是因此手机里就会留存一大堆照片,既占内存,又会显得杂乱无章,翻看照片的时候效果也不够好.其实把手机照片做成视频的话,就不会有这些烦恼了.而且现在很多社交平台上非常 ...

  6. linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)

    PhyML利用氨基酸序列建树步骤 (核酸建树也可以作为参考) 前言:本文阅读对象适合建树新手,生物信息学高手请勿嘲笑,其中有什么错误还恳请指点.为什么要建树及其你要解决什么问题这里不做讨论,只是一个纯 ...

  7. linux系统发育树的构建步骤,megacc构建进化树.mao文件生成方法

    基于linux版megacc构建系统进化树命令如下: /biosoft/MEGA/megacc -a .mao -d fasta -o ./ -a输入的是构建进化树的参数 .mao文件 -d输入的是多 ...

  8. 视频 | 生信Linux - 系统发育树构建1

    点击阅读原文跳转完整教案. 1 Linux初探,打开新世界的大门 1.1 Linux系统简介和目录理解 1.1.1 为什么要用Linux系统 1.1.2 Linux系统无处不在 1.1.3 免费的Li ...

  9. 如何把Linux的虚拟内存调成0,手把手教您扩展虚拟内存

    导读 在linux磁盘刚分区的时候,我们会划分一个swap分区,这块分区作为一块虚拟内存,承担着扩充内存的作用.然而在工作中我们会遇到虚拟内存也不够用的情况,这个时候我们也不能重新给磁盘进行分区,只能 ...

最新文章

  1. poj 3007 Organize Your Train part II (哈希)
  2. 日常SQL常见问题(二)
  3. C语言的那些秘密之---函数返回局部变量(转)
  4. SAP License:SD条件类型对应科目配置
  5. Ubuntu学习(应用集合、命令行以及遇到的问题)
  6. bug10-graphviz.backend.ExecutableNotFound: failed to execute [‘dot‘, ‘-Tpdf‘, ‘-O‘, ‘Source.gv‘]
  7. 查找算法---二分查找(递归方式)
  8. WFDB工具箱在Matlab2010b及更高版本上的安装
  9. 开启samba服务的设置步骤
  10. 发电厂与变电站高低压工程设计
  11. PS中放大图片不失真的方法
  12. 转载Faster-rcnn理解
  13. 74LVC245AD技术资料
  14. 判断一点是否在多边形内(附Java实现代码)
  15. 以太坊:创建安全多签名钱包及高级设置
  16. java pkcs12_如何阅读pkcs12文件内容?
  17. 杂谈 (1):论数学学习与教学体系
  18. 企业IPPBX有哪些功能
  19. 如何在Mac上禁用屏幕快照预览缩略图
  20. JDBC(本质,配置环境变量,JDBC编程六步,类加载注册,sql注入,事务问题,封装工具类,悲观锁,乐观锁)

热门文章

  1. 多因子模型水平测试题
  2. 小黄鸭调试法-程序猿修炼之道
  3. 医院收费小票打印简易版
  4. Android中连接MySql数据库获取数据的简单实现
  5. 今日晚餐:姹紫嫣红阳春面
  6. 塔菲尔曲线如何分析_2020-10-16 Tafel曲线测试步骤
  7. 为啥你总是焦虑?郁闷?痛苦?
  8. 首次亮相数博会,维择科技带产品dCube吸睛无限……
  9. 链锯:基于链接的自动化工作流漏洞生成
  10. mac下更改vue add的默认npm淘宝镜像