linux系统发育树的构建步骤,手把手教你用 Fast Tree 快速构建序列进化树
常见的建树方法有:贝叶斯法(Bayesian),最大似然法(Maximum likelihood,ML),最大简约法(Maximum parsimony,MP),邻接法(Neighbor-Joining,NJ),最小进化法(Minimum Evolution,ME),类平均法(UPGMA)。
一般来讲,如果模型合适,最大似然法的效果较好。对于近缘序列,最大简约法用的假设最少,各种方法结果相似。而对于远缘序列,一般使用最大似然法或邻接法。对相似度很低的序列,邻接法往往出现 Long-branch attraction(LBA,长枝吸引现象),严重干扰进化树的构建。对于各种方法构建分子进化树的准确性,Hall 认为贝叶斯的方法最好,其次是最大似然法,然后是最大简约法。其实如果序列的相似性较高,各种方法结果差别不大。
最大似然法和邻接法需要选择模型。对于蛋白质序列,一般选择 Poisson Correction(泊松修正)模型。而对于核酸序列,一般选择 Kimura 2-parameter(Kimura-2 参数)模型。
表 1. 构建进化树的常用软件
软件名称简介
Clustal X图形化的序列比对工具
GeneDoc多序列比对结果美化工具
BioEdit序列分析综合工具
MEGA图形化比对,进化分析综合工具
PAUP进化分析工具
Phylip进化分析工具
PhyML最大似然法建树工具
PAML最大似然法建树工具
MrBayes贝叶斯法建树工具
FastTree最大似然法建树工具(速度快)
TreeView进化树显示工具
本文主要讲 FastTree 使用方法:
首先介绍几点特性:
1. 在默认参数下,FastTree 比 PhyML 更准确,比 PhyML 快 100~1000 倍;
2.FastTree 使用模型为:核酸进化模型:Jukes-Cantor 或者 GTR(generalized time-reversible);蛋白进化模型:JTT (Jones-Taylor-Thornton 1992), WAG (Whelan & Goldman 2001) 或者 LG (Le and Gascuel 2008)
下载,安装 FastTree
FastTree 提供以下几个版本:
Linux 64-bit executable (+SSE)
Multi-threaded executable (+SSE +OpenMP) (see usage guide)
Windows 32-bit command-line executable (no SSE)
C code
下载 Windows 32-bit command-line executable (no SSE) 后,是一个 FastTree.exe 文件,可以直接在 cmd 命令行程序中调用运行。
新建一个文件夹:比如在 D 盘目录下新建一个 FastTree 文件夹,将 FastTree.exe 程序放在 D:FastTree 目录下。
FastTree 运行(Windows 为例)
开始菜单—搜索—cmd
切换目录到 D:FastTree
最大似然树构建:FastTree protein alignment file > tree
在目录 D:FastTree 生成.tree 文件,可以使用 TreeView 或 MEGA 打开。
构建进化树时,可以选择不同的模型:
命令行:D:FastTree>FastTree -lg CIPK.phy >CIPK.tree
alignment file 格式
alignment file 格式如上图。
可以首先使用 Clustal X 比对序列:Alignment—Output Format Options—Phylip format
比对后,在比对目录下生成几个文件,其中.phy 后缀名文件是 FastTree 要使用的。
参考文献:
Hall B G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences[J]. Molecular Biology and Evolution, 2005, 22(3): 792-802.
Price, M.N., Dehal, P.S., and Arkin, A.P. (2009) FastTree: Computing Large Minimum-Evolution Trees with Profiles instead of a Distance Matrix. Molecular Biology and Evolution 26:1641-1650.
Price, M.N., Dehal, P.S., and Arkin, A.P. (2010) FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490.
Jones D T, Taylor W R, Thornton J M. The rapid generation of mutation data matrices from protein sequences[J]. Computer applications in the biosciences: CABIOS, 1992, 8(3): 275-282.
Whelan S, Goldman N. A general empirical model of protein evolution derived from multiple protein families using a maximum-likelihood approach[J]. Molecular biology and evolution, 2001, 18(5): 691-699.
Le S Q, Gascuel O. An improved general amino acid replacement matrix[J]. Molecular biology and evolution, 2008, 25(7): 1307-1320.
作者:muminwangzi
linux系统发育树的构建步骤,手把手教你用 Fast Tree 快速构建序列进化树相关推荐
- 今晚直播 | 谷歌资深工程师手把手教你使用TensorFlow最新API构建学习模型
目前,深度学习的研究和应用大受追捧,各种开源的深度学习框架层出不穷.TensorFlow 作为目前最受欢迎的深度学习框架,已经在 GitHub 上获得了 112194 个 star,受欢迎程序可见一斑 ...
- linux wait函数头文件_手把手教Linux驱动9-等待队列waitq
在上一篇<手把手教Linux驱动8-Linux IO模型>我们已经了解了阻塞.非阻塞.同步和异步等相关概念,本文主要讲解如何通过等待队列实现对进程的阻塞. 应用场景: 当进程要获取某些资源 ...
- linux刻录win10u盘_手把手教你装系统之【制作官方win10安装U盘】
本帖最后由 蚂蚁炒花甲 于 2019-11-11 22:58 编辑 很多粉粉在收到linux版本的笔记本后 用不惯,但又不知道如何装win10系统 下面我就来教大家,如何自己动手 制作win10 安装 ...
- 手把手教你用FineBI,快速搭建可视化驾驶舱
相信大家最近都看过许多关于管理驾驶舱的文章,有些驾驶舱数据分析页面确实是狂拽炫酷得不行,但是对于这些页面具体的制作过程,怎么样最佳展现数据的业务价值,想必大家还是有些云里雾里. 本篇文章以销售管理驾驶 ...
- 手机照片怎么做成视频?手把手教你,3步快速完成动感效果
现在出行用手机拍照是最方便不过的了,但是因此手机里就会留存一大堆照片,既占内存,又会显得杂乱无章,翻看照片的时候效果也不够好.其实把手机照片做成视频的话,就不会有这些烦恼了.而且现在很多社交平台上非常 ...
- linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)
PhyML利用氨基酸序列建树步骤 (核酸建树也可以作为参考) 前言:本文阅读对象适合建树新手,生物信息学高手请勿嘲笑,其中有什么错误还恳请指点.为什么要建树及其你要解决什么问题这里不做讨论,只是一个纯 ...
- linux系统发育树的构建步骤,megacc构建进化树.mao文件生成方法
基于linux版megacc构建系统进化树命令如下: /biosoft/MEGA/megacc -a .mao -d fasta -o ./ -a输入的是构建进化树的参数 .mao文件 -d输入的是多 ...
- 视频 | 生信Linux - 系统发育树构建1
点击阅读原文跳转完整教案. 1 Linux初探,打开新世界的大门 1.1 Linux系统简介和目录理解 1.1.1 为什么要用Linux系统 1.1.2 Linux系统无处不在 1.1.3 免费的Li ...
- 如何把Linux的虚拟内存调成0,手把手教您扩展虚拟内存
导读 在linux磁盘刚分区的时候,我们会划分一个swap分区,这块分区作为一块虚拟内存,承担着扩充内存的作用.然而在工作中我们会遇到虚拟内存也不够用的情况,这个时候我们也不能重新给磁盘进行分区,只能 ...
最新文章
- poj 3007 Organize Your Train part II (哈希)
- 日常SQL常见问题(二)
- C语言的那些秘密之---函数返回局部变量(转)
- SAP License:SD条件类型对应科目配置
- Ubuntu学习(应用集合、命令行以及遇到的问题)
- bug10-graphviz.backend.ExecutableNotFound: failed to execute [‘dot‘, ‘-Tpdf‘, ‘-O‘, ‘Source.gv‘]
- 查找算法---二分查找(递归方式)
- WFDB工具箱在Matlab2010b及更高版本上的安装
- 开启samba服务的设置步骤
- 发电厂与变电站高低压工程设计
- PS中放大图片不失真的方法
- 转载Faster-rcnn理解
- 74LVC245AD技术资料
- 判断一点是否在多边形内(附Java实现代码)
- 以太坊:创建安全多签名钱包及高级设置
- java pkcs12_如何阅读pkcs12文件内容?
- 杂谈 (1):论数学学习与教学体系
- 企业IPPBX有哪些功能
- 如何在Mac上禁用屏幕快照预览缩略图
- JDBC(本质,配置环境变量,JDBC编程六步,类加载注册,sql注入,事务问题,封装工具类,悲观锁,乐观锁)