核酸蛋白质序列进化分析.ppt
文本预览下载声明
MP法决定系统树的拓扑结构 特定结构树的最小替代数目估计 1 2 3 4 5 6 A A A G G T A G G G 1 2 3 4 5 6 A A A G G T A A A T 祖先节点的核苷酸不能完全唯一确定。 计算所有结构树并选取最短树长 对于任一给定的拓扑结构,计算它的树长(即所有位点的最小替代数目之和)L; 选取具有最短树长的拓扑结构为最大简约树。 信息位点、趋同进化 不变位点:在所有分类群中相同核苷酸或氨基酸的位点。 不变位点不提供任何信息。 简约信息位点:位点上至少有两种不同的核苷酸或氨基酸,且每种至少出现两次。 MP法构建系统树的位点: 只利用简约信息位点; 既利用简约信息位点,也利用单一位点。 单一位点:位点上只有一个分类群具有一种不同的核苷酸或氨基酸。 对所有的拓扑结构都只能用相同的替代数目表示。 单一位点也不提供任何MP信息。 MP法决定系统树的分支长度 进化通径:考虑任意两个密码子之间变换的可能路径 分支长度估计 通过考虑每个非不变位点的所有进化通径,并计算每个内部分支或外部分支的平均替代数来估计MP树的分支长度。 (具体算法略) MP法评述 MP法适用的问题 位点不存在回复突变、平行突变; 被分析的序列较长,核苷酸或氨基酸数目很大; 序列的相似度较高; 核苷酸或氨基酸替代速率较稳定。 ML算法基本思想 (Felsenstein, 1981; Kishino, 1990) 以一个特定的替代模型分析一组给定的核苷酸(或氨基酸)序列数据,使获得的每一个拓扑结构的似然率均为最大,挑选其中最大似然率最大的拓扑结构,选为最终系统树。 ML法考察的既可以是拓扑结构,也可以是既定拓扑结构的分支长度。 ML法采用了标准的统计方法,以建立进化的概率模型。 计算量非常大。 7.5 系统发育树构建的最大似然法 (Maximum Likelihood Method) Arizona大学开发的软件 /tree/program/program.html Tree of Life It includes parsimony, distance matrix, invariants, and maximum likelihood methods and many indices and statistical tests. / PAUP It includes programs to carry out parsimony, distance matrix methods, maximum likelihood, and other methods on a variety of types of data, including DNA and RNA sequences, protein sequences, restriction sites, 0/1 discrete characters data, gene frequencies, continuous characters and distance matrices. /phylip.html PHYLIP 说明 网址 软件名称 7.6 分子进化与系统发育分析常用的软件 美国宾州州立大学Masatoshi Nei开发(It carries out parsimony, distance matrix and likelihood methods for molecular data.) MEGA 日本国立统计数理研究所开发。(Carrying out maximum likelihood inference of phylogenies for either nucleotide sequences or protein sequences.) http://www.ism.ac.jp/software/ismlib/softother.e.html#molphy MOLPHY EBI的系统发育树分析软件 http://www.ebi.ac.uk/biocat/phylogeny.html phylogeny A program for displaying trees on Apple Macs and Windows PCs. It can draw rooted and unrooted trees, display bootstrap values, and supports the native font and graphics file formats of both Macs and P
显示全部