如何使用Mega cc

Table of Contents

  • 1 github地址:
  • 2 下载
  • 3 使用
    • 3.1 安装
    • 3.2 输入文件
    • 3.3 输出文件
    • 3.4 运行MEGA-CC
    • 3.5 MEGA-Proto (分析模版)
    • 3.6 Demo1:实例1
    • 3.7 Demo2: 实例2
    • 3.8 自我实例
  • 4 mao 文件简单解析
  • 5 在Linux下如何使用

1 github地址:

https://github.com/gaorongchao/Perl/tree/master/Bio/Mega

所有后续更新都在github上进行,其他地方不做同步。 发现任何错误,或者不当的地方,请先到github查看是否改正。 如果没有请留言。或者邮件交流:rongchaogao@gmail.com

2 下载

http://www.megasoftware.net/megaccusage.php

先从上面的网址下载,阅读上面的下载协议。 然后选“Accept Agreement”,然后就开始下载了。 下载以后我们得到“M6CC.zip”的文件。 然后解压。

解压以后得到几个文件。

  • M6CC.exe
  • M6Proto.exe #这两个是主程序,是我们要用到的
  • MEGA-CC-Quick-Start-Tutorial.pdf # 这个是使用的教程
  • Usage Agreement.pdf # 使用协议,不用看
  • Examples # 这个文件夹提供了我们学习MEGACC所需要的文件

3 使用

使用过程是从解压以后得到的PDF手册翻译加工整理而来。

3.1 安装

你可以在上面得到的解压文件中直接使用。 也可以直接把起作用的两个执行文件M6CC.exe 和 M6Proto.exe 拷贝到你喜欢的文件夹中。 下面的两个实例需要你也把Example文件也拷贝过去。

3.2 输入文件

1:分析配置文件:也就是你要用MEGA的什么参数进行分析的一个参数设定的集合。 这个是用MEGA-Proto来生成的。 生成的文件是一个 .mao为后缀的文件。

2:数据文件(下面的任意一个都可以)

  • Multiple sequence alignment in MEGA or Fasta format.
  • Distance matrix in MEGA format.
  • Unaligned sequences in Fasta format (f or alignment only)

3:树文件(某些分析需要) .nwk文件格式。

3.3 输出文件

一般情况下生成两种输出文件

  • 1. Calculation-specific results file (Newick file, distance

matrix,…).

  • 2. A summary file with additional info (likelihood, SBL,…).

, Some analyses produce additional output (bootstrap consensus tree).

输出的文件夹和文件名称

  • 1:默认和输入文件在同一个文件夹
  • 2:如果要改变文件夹或者文件名称,那么用-o 选项。
  • 3: If no output filename is specified, MEGA-CC will assign a unique name.

错误和警告:

如果MEGA-CC产生了错误或者警告信息。那么会出现在summary file文件中。

3.4 运行MEGA-CC

用命令行运行非常简单。

M6CC.exe -a options.mao -d alignment.meg -o outFile

也可以用一些脚本程序来运行,比如Perl,Python。 这里我们用exec发现会出问题,所以这里改成用system来进行调用。

#exec('M6CC.exe -a options.mao -d alignment.meg -o outFile');
system ('M6CC.exe -a options.mao -d alignment.meg -o outFile');

MEGA-CC附带完善的文件迭代系统,来处理多个文件,而不用脚本来帮忙。 具体可以参考下面第二个实例。

其他的应用也可以调用MEGA-CC:

status = CreateProcess("M6CC.exe...");

如果要查看更多的命令选项,那么从命令行中调用M6CC.exe -h

3.5 MEGA-Proto (分析模版)

MEGA-Proto有以下特点:

  • 第一:和图形界面版本一样的外观
  • 第二:生成MEGA分析所需要的选项文件
  • 第三:没有计算能力,只是一个模拟的过程

双击打开MEGA-Proto以后,图形界面会引导你进行一下步骤。

第一步:选择序列类型。 包含四种类型。

Nucleotide (non-coding)
Nucleotide (coding)
Protein (amino-acid)
Distance matrix (MEGA format)

第二步:从上面的菜单中选择一项分析过程。

第三步:调整分析的参数设置。

第四步:保存你设置好的MEGA分析的选项到一个文件。

3.6 Demo1:实例1

本实例展现了如何用MEGA-Proto 和MEGA-CC来完成 “Maximum Likelihood phylogeny reconstruction”。

  • 第0步:准备文件。

为了能够正确的完成这个实例,你需要确认你有了M6CC.exe, 以及M6Proto.exe这两个程序(我们上面下载的就是)。 实例所需要的文件就是我们上面解压得到的。

  • 第1步:双击或者右键打开MEGA-Proto.exe。
  • 第2步:选择输入的数据类型。这里我们用的是默认设置。Nucleotide (non-coding)。
  • 第3步:在菜单栏中选择:Phylogeny => Construct/Test Maximum Likelihood Tree
  • 第4步:调整参数,然后点击“Save Settings”。把文件“mlDemo.mao”保存在当前文件夹。
  • 第5步:打开一个命令行界面。也就是win+R,cmd。然后用cd命令切换到M6CC.exe所在的文件夹。
  • 第6步:用M6CC.exe执行程序来分析文件。
M6CC.exe -a mlDemo.mao -d Examples\Crab_rRNA.meg -o demoResults
  • 第7步:程序开始执行。会有进度的显示。执行完成以后退出。
  • 最后 :分析得到3个输出文件。
* demoResult.nwk
这个文件是用我们给定的设置参数得到的Maximum Likelihood 树。
* demoResult_consensus.nwk
这个文件是Mega 从所有的bootstrap sample trees中得到的bootstrap consensus树。
* demoResult_summary.txt
这个文件给出了分析数据:比如log likelihood value of the Maximum Likelihood tree,ts/tv ratio etc...

3.7 Demo2: 实例2

下面这个例子展示了,如何用MEGA-CC中的文件迭代系统, 用同一个配置文件(也就是MEGA-Proto得到的文件)来处理多个输入文件。

第0步:启动

这个就是第一个Demo1中的前5个过程,如果还搞不定的话,自己去复习。

第1步:新建一个文件,命名为 demo2Data.txt。这里面包含我们要处理的多个文件。 一行是一个文件。 在这个文件中,有两个文件“Grab_rRNA.meg” 和“Drosophila_Adh.meg”。 文件添加完全的路径。大致是下面的样子。

D:\M6CC\Examples\Crab_rRNA.meg
D:\M6CC\Examples\Drosophila_Adh.meg

第2步:然后在命令行中用如下命令调用MEGA-CC:

M6CC.exe -a mlDemo.mao -d demo2Data.txt

上面的命令行没有指定输出的文件夹,以及文件名称。不过不用担心。 所有的结果都会根据你的文件名来命名,并且输出到“M6CC_Out”文件夹中。

第3步:然后分析会启动。一个个的处理文件。处理的进度会显示在命令行界面中。

最后 :分析程序会对每一个输入文件产生一个输出结果。 在这个例子中,相同的分析配置文件用在每一个文件中。

3.8 自我实例

下面是一个用Perl调用的小脚本:

use strict;
use warnings;my @files = glob "*.fasta";
foreach my $file (@files)
{system ("M6CC.exe -a huashu.mao -d $file -o $file.out");
}

使用的huashu.mao都在github上。

同时我们也可以用MEGA-cc自带的多文件处理功能。 Perl脚本用来提取所有需要处理文件的文件名到file.txt,这个文件名要包含完全的路径。

use strict;
use warnings;my $out_out = "file.txt";
open  my $out, '>', $out_out or die  "Fail open $out_out\n";
my @files = glob "*.fasta";
foreach my $file (@files)
{print $out "D:\\Less_less_region\\$file\n";
}
close  $out;

然后用上面的多个文件处理的方法:

M6CC.exe -a huashu.mao -d file.txt

但是用上面的方法来处理文件的时候,只有一半的文件被处理,基本上是处理一个,跳过一个。 不知道是什么原因。解决办法是:在上面的输出文件名称到file.txt的时候, 每一个文件都输出两遍。仅仅是一种解决方案,没有找到真正原因。

use strict;
use warnings;my  $out_out = "file.txt";
open  my $out, '>', $out_out or die  "Fail open $out_out\n";
my @files = glob "*.fasta";
foreach my $file (@files)
{print $out "D:\\Less_less_region\\$file\n";print $out "D:\\Less_less_region\\$file\n";
}
close  $out;

4 mao 文件简单解析

mao文件是我们用M6Proto.exe通过模拟分析得到的一个参数列表。 但是他的本质就是一个文本文件。我们可以用文本编辑器打开。

; Please do not edit this file! If this file is modified, results are unpredictable.
; Instead of modifying this file, simply create a new MEGA Analysis Options file by using the MEGA Prototyper.
[ MEGAinfo ]
ver=0
[ DataSettings ]
datatype=snNucleotide
containsCodingNuc=False
missingBaseSymbol=?
identicalBaseSymbol=.
gapSymbol=-
[ ProcessTypes ]
ppInfer=true
ppNJ=true
[ AnalysisSettings ]
Analysis=Phylogeny Reconstruction
Scope=All Selected Taxa
Statistical Method=Neighbor-joining
Phylogeny Test=====================
Test of Phylogeny=Bootstrap method
No. of Bootstrap Replications=500
Substitution Model=====================
Substitutions Type=Nucleotide
Model/Method=p-distance
Substitutions to Include=d: Transitions + Transversions
Rates and Patterns=====================
Rates among Sites=Uniform rates
Gamma Parameter=Not Applicable
Pattern among Lineages=Same (Homogeneous)
Data Subset to Use=====================
Gaps/Missing Data Treatment=Pairwise deletion
Site Coverage Cutoff (%)=Not Applicable

虽然文件的第一行,不让我们修改,但是我们仔细看一下每一行的意思以后。 完全可以进行小的改动。这样就不必要每一个小的改动,都去使用M6Proto.exe 这个程序。

比如,上面有一行 No. of Bootstrap Replications=500。 这个我们非常容易理解,就是设置Bootstrap的次数,如果你想改成1000,那就直接从mao文件 中修改吧。

5 在Linux下如何使用

官方的说法是现在只支持windows系统,暂时还不支持Mac和Linux。 Mega只能用最大4G的内存。

MEGA CC is developed for use on Microsoft Windows operating systems, including XP, Vista, Windows 7, and Windows 8. The version is limited to 32-bit execution, but should run fine on 64-bit systems. 32-bit limitations will still apply ex. MEGA can only use max 4gb of memory. At this time Mac and Linux are not supported.

Date: 2014-03-30T19:13+0800

Author: GRC(扬眉剑)

Org version 7.9.3f with Emacs version 24

Validate XHTML 1.0

如何使用Mega cc相关推荐

  1. 1500: [NOI2005]维修数列 (Splay)

    1W1A(inf开太大) #include<algorithm> #include<iostream> #include<cstring> #include< ...

  2. Mega使用及R语言中多序列比对

    安装 https://www.megasoftware.net/,下载windows的GUI版本,要使用CC(命令行)版本–配置好环境变量即可.然后如果觉得windows配置不好,也可以安装linux ...

  3. Arduino mega 2560 上传项目总是出错最全解决方案以及串口测试教程

    一:串口识别和驱动安装需要保证准确无误 1.运行arduino mega 2560 首先需要安装串口驱动,这样我们用USB将板子和我们计算机连接的时候,使得我们的计算机能够识别连接的串口并且能够连接上 ...

  4. MEGA训练自己的数据集-docker

    paper:https://arxiv.org/abs/2003.12063 code:https://github.com/Scalsol/mega.pytorch 目录 1.环境创建 1.1 创建 ...

  5. 5组LOGO标志演绎展示片头动画 Logo Intro Mega pack

    Logo Intro Mega pack是一组AE模板,包含5组LOGO标志演绎展示片头动画,可以为视频制作非常棒的片头或者片尾. 适用软件: After Effects CC 或更高 分辨率:384 ...

  6. Cocos Creator里cc.tween的stopAllActions() 和 repeatForever的用法

    this.useNowBtn.stopAllActions(); this.useNowBtn.setPosition(46 + t * 120, 360); cc.tween(this.useNow ...

  7. ORB_SLAM2程序入口(System.cc)

    程序入口   ORB_SLAM2的程序入口为src/System.cc.在CMakeList.txt中可知,ORB_SLAM2的可执行程序为: Examples/Stereo/stereo_kitti ...

  8. ORB_SLAM2源码:ORBmatcher.cc

      ORBmatcher.cc中的函数,主要实现(1)路标点和特征点的匹配(2D-3D点对).(2)特征点和特征点的匹配(2D-2D点对).SearchByProjection的函数重载看得我一脸懵逼 ...

  9. 如何安装蓝湖插件支持Photoshop CC 2017

    蓝湖 - 高效的产品设计协作平台蓝湖是一款产品文档和设计图的共享平台,帮助互联网团队更好地管理文档和设计图.蓝湖可以在线展示Axure,自动生成设计图标注,与团队共享设计图,展示页面之间的跳转关系.蓝 ...

最新文章

  1. 扩增子统计绘图5火山图:差异OTU数量及变化规律
  2. 数据库面试题【一、事务四大特性】
  3. PowerToys插件扩展(类似Alfred)
  4. minGW, cygwin, GnuWin32【C++的跨平台交叉编译问题】
  5. leetcode 35. 搜索插入位置(二分法搜索失败的情况)
  6. 【CodeForces】741 D. Arpa’s letter-marked tree and Mehrdad’s Dokhtar-kosh paths(dsu on tree)
  7. Harmony OS — TimePicker时间选择器
  8. 《MySQL必知必会》学习笔记——第四章(检索数据)
  9. Linux网络编程——UDP编程
  10. Java8遍历Map、Map转List、List转Map
  11. 大咖说|翼辉丁晓华:我们已经真正意义上感受到了原始创新带来的巨大价值
  12. oracle生成流水号序列,Oracle序列生成订单流水号
  13. 25.redux中间件redux-thunk和redux-saga
  14. python随笔:round函数的使用
  15. matlab解rlc电路方程,RLC电路matlab仿真.pdf
  16. I.MX6ULL之LCD显示
  17. dz邮箱验证怎么设置_详细步骤!Discuz如何设置通过 SOCKET 连接 SMTP 服务器发送(支持 ESMTP 验证)实现论坛邮箱验证功能...
  18. MySQL日期类型及默认设置
  19. 基于 React Native 的 58 同城 App 开发实践
  20. css3实现字体从左到右渐变(原理与思路)

热门文章

  1. TCP/IP 网络通信协议 之 OSI 七层模型
  2. Navicat Premium12 安装报错、解决办法
  3. vs 指定的启动url无效
  4. linux 解压war到root_在LINUX下如何将tar压缩文件解压到指定的目录下
  5. 指针式仪表自动读数与识别(一)
  6. 基于libco的c++协程实现(时间轮定时器)
  7. Google Earth Engine (GEE) ——卫星影像的监督分类(svm)
  8. Windows历代版本一览
  9. 牛散村:Java字节码编程javassist的详细介绍
  10. EasyChm 3.84正版工具破解补丁