PhyML利用氨基酸序列建树步骤

(核酸建树也可以作为参考)

前言:本文阅读对象适合建树新手,生物信息学高手请勿嘲笑,其中有什么错误还恳请指点。为什么要建树及其你要解决什么问题这里不做讨论,只是一个纯粹的建树过程,前期的序列收集过程自己费心,根据自己的需要来做。这里主要是最大似然法来建树,NJ法像mega这些软件中都有集成,最新的mega7也集成ML法,不过模型及各种参数不一定适合你,所以学习多种多种方法也是有用的,PhyML速度较慢,如果数列数量较多、步长检验次数多,等待时间会很长,有可能达到几十小时,也与电脑配置有关,一般时间都是以小时计数,所以要有心理准备,如果数据量大,推荐用RaxML或其他方法建树,它处理速度要比PhyML 快,不过RaxML是纯命令操作,对不熟悉命令及参数意义的人有一定难度,我只在linux 下操作过,在win下没有使用过。本文是用氨基酸建树过程,如果你是用核酸序列建树,也可以参考这个过程,核酸替代模型请用jmodeltest或其他同功软件计算。

由于PhyML计算过程比较长,做一遍比较耗时,推荐你用其他软件用NJ法先行试验建树,看看你选择的序列是否有效及符合你的预期结果,调整好序列后再用PhyML跑一遍看结果是否符合自己的要求。

PhyML有线上版本,只需要提交序列比对结果,设置模型参数,留下邮箱等待就会给你返回结果,不过时间不可控,根据自身情况选择线上还是本地自己建树。水平有限,如有错误遗漏恳请各位指点。如果在文库不能下载,可以去网盘下载,见文末。

●建树过程:序列准备-模型选择-建树及树的验证。

●环境准备:电脑^-^Windows或者Linux都可以(没试过mac,如果是mac环境,请参考

具体的操作手册)、ProtTest、PhyMl及序列比对的软件,线上或本地都可以。

1.序列准备:

在自己熟悉的数据库中(我自己比较熟悉Ncbi)上做blast,选取跟要建树蛋白同源的各物种序列,下载到本地,整合到一个fasta文件中,注意修改物种名称,字数最好不要太长,序列比对后.phy格式文件对文件名长度有限制(这个可能跟软件有关系,只要自己知道是什么物种,不至于混淆就行),注意规范性,fasta文件中最好除了>头标,字母及下划线不要有其他不相关的字符,因为如果后面你要用软件分析.phy文件的时候这些软件对.phy的格式要求比较变态,有其他多余字符它都会报错的(你如果在dos 下用命令合并文件请注意文件中最后一行的字符,请删除)。做序列分析,常用的分析软件有clustalW系列,mega也集成了蛋白比对工具,线上线下各种软件自由选择,区别不大,保存的格式可以选择多一点,主要是看你后续操作。如clustalx 比对可以保存的结果格式如图1所示。选中你希望的格式保存即可。

linux系统发育树的构建步骤,分子进化树构建的简要步骤(以蛋白为例)相关推荐

  1. linux系统发育树的构建步骤,手把手教你用 Fast Tree 快速构建序列进化树

    常见的建树方法有:贝叶斯法(Bayesian),最大似然法(Maximum likelihood,ML),最大简约法(Maximum parsimony,MP),邻接法(Neighbor-Joinin ...

  2. linux系统发育树的构建步骤,megacc构建进化树.mao文件生成方法

    基于linux版megacc构建系统进化树命令如下: /biosoft/MEGA/megacc -a .mao -d fasta -o ./ -a输入的是构建进化树的参数 .mao文件 -d输入的是多 ...

  3. 视频 | 生信Linux - 系统发育树构建1

    点击阅读原文跳转完整教案. 1 Linux初探,打开新世界的大门 1.1 Linux系统简介和目录理解 1.1.1 为什么要用Linux系统 1.1.2 Linux系统无处不在 1.1.3 免费的Li ...

  4. 【超详细】Linux内核树的构建

    本文档因为过于繁琐,现已弃用.最新教程请见[Linux内核树]五步构建. 目录 前言 检查是否已有构建好的内核树 下载内核源码 开始构建 1. 安装必须的包 2. 生成配置文件 3. 开始make 附 ...

  5. 使用GENBANK数据进行分子系统发育树的构建

    一.引言 GENBANK是目前最大而权威的分子序列数据库,调用其中数据可以进行分子系统发育树的构建. 1.序列数据获取(以皿蛛系统发育树为例) 在GenBank中,每一个物种或阶元都有一个taxid, ...

  6. vbn中使用的3种流程控制结构是_细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定...

    细菌进化树 • 构 建 细菌进化树构建:从模式种序列下载到构建系统发育树一键搞定 对于细菌新种或者新属的发现,总是那么让人期待,但是当我们批量获得16S序列后,逐一对这些尚不知分类地位的序列进行比对并 ...

  7. linux下phylip软件构建NJ树,进化树构建-NJ法lpar;megarpar;

    进化树构建-NJ法 V1.2 By ZHAO Yangguo, email: sunshine.zhao@yahoo.com.cn 通过长期的分析认为对于16S rDNA序列的进化(Phyligene ...

  8. iMeta | 兰大张东等使用PhyloSuite进行分子系统发育及系统发育树的统计分析

    点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方  法 ● 原文链接DOI: https://d ...

  9. iMeta | 兰州大学张东青年研究员:使用PhyloSuite进行分子系统发育及系统发育树的统计分析...

    点击蓝字 关注我们 使用PhyloSuite进行分子系统发育及系统发育树的统计分析 iMeta主页:http://www.imeta.science 方  法 ● 原文链接DOI: https://d ...

最新文章

  1. extensionloaded php,php中extension_loaded()函数的使用详解
  2. Unity3d 布娃娃系统
  3. gin使用BasicAuth()(验证)中间件
  4. 在数组中找到一个局部最小的位置
  5. 工业级光纤收发器一般能正常使用多长时间?
  6. N1CTF 塞题vote分析
  7. 全国计算机等级考试汇编,2011年3月汇编全国计算机等级考试(南开100题三级网络技术上机试题汇编)...
  8. 获取roi内的xld_提升ROI是王道,这几种推广获客渠道与形式你还不知道?
  9. Java 多线程(六)——进程间通信与线程间通信
  10. 2017中国大学生程序设计竞赛 - 女生专场C【前后缀GCD】
  11. jQuery对象与DOM对象之间的转换
  12. css 水印_Inpaint,一款简洁干净的去水印软件
  13. Android鞋店管理系统,鞋店进销管理系统下载
  14. 深圳大学现代通信技术测试题
  15. BT.601和BT.656
  16. java编码解码工具类
  17. matlab交流电路仿真,单相交流调压电路Matlab仿真
  18. 论文阅读 Neural Network Modeling of Nonlinear Systems Based on Volterra Series Extension of a Linear Mod
  19. 如何将时间序列分解为周期序列和趋势序列的和?
  20. 细节--Java必须先创建文件夹再创建文件

热门文章

  1. DevExpress的 ASPxGridview控件的自动配置效果
  2. arduino(12):电子价标签管理系统,瞎折腾从网上搜索相关资料,有用的没有用的都罗列下,然后看看能不能做个电子价签系统,Electronic price tag
  3. 华为系统鸿蒙什么意思,华为新推出的鸿蒙系统是什么意思,怎么去理解?
  4. 组播IGMP Snooping理论知识
  5. Android BLE 蓝牙开发-扫码枪集成
  6. IOS 分享 牛人 Demo
  7. Android Studio 开发--近场通信技术
  8. 创建一个3D角色模型很难?3dmax和maya低模手绘角色制作步骤
  9. 分析静态网页客户服务器工作过程,(静态网页制作课程标准.doc
  10. Day85.降低Cache失效率的方法 -计算机体系结构