1、MEGA软件构建系统发育树摘要 :以白色念珠菌属下面十个种18s RNA 为例,构建系统发育树来阐明MEGA软件用法。1背景简介1.1 MEGA(分子进化遗传分析)MEGA 全称是Molecular Evolutionary Genetics Analysis。MEGA is an integrated tool for automatic and manual sequence alignment,inferring phylogenetic trees,mining web-based databases,estimating rates of molecular evolution,an
2、d testing evolutionary hypotheses. MEGA 可用于序列比对、进化树推断、预计分子进化速度、验证进化假说等。MEGA 还可以通过网络(NCBI)进行序列比对和数据搜索。 最新版本:MEGA 5.1 Beta (软件开发者建议其成果不用于刊登文章) 建议下载版本:MEGA 5.05 for Windows and Mac OS。 MEGA 5 has been tested on the following Microsoft Windows operating systems:Windows 95/98,NT,XP,Vista,version 7,Linux
3、and Mac OS 1. MEGA 5.05 可免费下载,只需输入名字及有效邮箱,下载链接会发送至邮箱,点击可下载。1.2 系统发育树定义系统发育树(英文:Phylogenetic tree)又称为演化树(evolutionary tree),是表白被以为具备共同祖先各物种间演化关系树。是一种亲缘分支分类办法(cladogram)。在树中,每个节点代表其各分支近来共同祖先,而节点间线段长度相应演化距离(如预计演化时间)1.3 系统发育树分类 依照有根和无根来区别:树可分为有根树和无根树两类。有根树是具备方向树, 依照系统发生树可推断出物种来源包括唯一节点,将其作为树中所有物种近来共同祖先。最
4、惯用拟定树根办法是使用一种或各种无可争议同源物种作为外群(英文outgroup),这个外群要足够近,以提供足够信息,但又不能太近以至于和树中种类相混。把有根树去掉根即成为无根树。一棵无根树在没有其她信息(外群)或假设(如假设最大枝长为根)时不能拟定其树根。无根树是没有方向,其中线段两个演化方向均有也许。 基于单个同源基因差别构建系统发生数应称之为基因树。由于这种树代表仅仅是单个基因进化历史。而不是它所在物种进化历史。物种树普通最佳是从各种基因数据分析中得到。例如一项关于植物进化研究中,用了100个不同基因来构建物种树,由于进化是发生在生物体种群水平上,而不是发生在个体水平上,虽然表面上不需要更
5、多数据,但事实上还是有必要。基因树和物种树之间差别是很重要,如果只用等位基因来构建物种数,那许多人人和大猩猩就会分到一起,而不是和其她人分到一起。1.4 构建办法要构建一种进化树(phyligenetic tree)。构建进化树算法主 要分为两类:独立元素法(discrete character methods)和距离依托法(distance methods)。所谓独立元素法是指进化树拓扑形状是由序列上每个状态决定,而距离依托法是指进化树拓扑形状由两两序列进化距离决定。进化树枝条长度代表着进化距离。独立元素法涉及最大简约性法(Maximum Parsimony methods)和最大也许性法(
6、Maximum Likelihood methods);距离依托法涉及除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。 2 蛋白质序列分析用法2.1 打开网址,将菌名输入到protein背面框内,点Search键,选取一种搜索成果点击进入2.2 将搜索出来成果选取send to下拉箭头内选项,Analysis Tool和BLAST,选取好后点击Submit进行搜索2.3 进入BLAST页面,点击页面最下面BLAST按钮,进行blast ,如图所示:2.4 从成果中选取10个蛋白质序列,进行复制,粘贴到TXT文档内,然后将TXT文档后缀名改为FASTA2.5 将保存好
7、,以Fasta做后缀序列打开,如下图2.6 点击菜单栏内Alignment选项,选取Align by ClustalW选项。2.7 弹出如下图对话框,选取OK键,对数据进行解决通过一段时间数据解决,数据解决完毕如下图所示:2.8 选取菜单栏中Data选项中Save Session选项进行保存。再选取Export Alignment中MEGA Format和 FASTA format 进行保存。2.9 选取菜单栏中 Analysis 选项中 Phylogeny中 Construct/Test Maximum Likelihood Tree选项进行数据解决。将数据按下表填写,点击Compute键数据将按下表方式解决:最大进化树如下所示:2.10 点击菜单栏下一行Distance选项,选取下拉菜单中第一种选项,进行数据解决浮现如下对话框,按下图所示,点击Compute键即可得出最后成果:3 核酸序列分析用法打开网址,别的办法同上,如下列图片所示,不再详述。