文档详情

计算机在生物学上运用数量分类学.ppt

发布:2018-08-29约2.44万字共68页下载文档
文本预览下载声明
数量分类学原理和方法0 问题的提出 生物分类的定量分类研究 分子生物学中的相似性与相异性研究 一·数量分类的基本概念:数量分类方法,分类运算单位与分类性状等 二·性状的选取与量化:性状选取的原则,性状编码,数据标准化 三·系统聚类分析:相似性系数,系统聚合方法等 四·排序分析:主成分分析等 数量分类学原理和方法1-1 一·数量分类的基本概念 (一)数量分类方法和数量分类学 英国微生物学家P.H.A.Sneath 英国动物与人类学家A.J.Cain 美国生物统计学家R.R.Sokal 1963年SneathSokal”数量分类学原理” 1973年SneathSokal”数量分类学:数值分类的原理和应用” 数量分类学原理和方法1-2 一·数量分类的基本概念 (二)分类运算单位与分类性状 分类运算单位(operational taxonomic unit,OUT)是数量分类学中一个抽象的基本运算单位,可以是一个个体、种、种群、群落、DNA序列、蛋白质的一级结构等等。 分类性状(character)是作为分类依据以区分不同事物的特征或属性。OUT在每个性状上所呈现出来的状况或数值称为性状状态(character state)。不能再分解的性状称为单位性状(unit character)。 数量分类学原理和方法1-3 一·数量分类的基本概念 (二)分类分析 1、聚类分析 运用数学方法研究OUT(或性状)之间的亲疏程度,以此为依据将一批OUT(或性状)聚合为若干OUT组(或性状组)。 常用的方法有聚合法、分裂法、加入法、图论法、模糊法、动态法。 数量分类学原理和方法1-4 一·数量分类的基本概念 (二)分类分析 2、排序分析 多数数量分类问题中,性状之间往往具有一定的相关性。利用这种相关性,可用若干综合指标去代替全部性状。为了使较少的综合指标尽可能全面地反映原来全部性状的信息,运用数学方法对性状进行压缩,并在压缩的空间中对OTU进行排序。这就是排序分析。 常见的有主成分分析(principal components analysis)和主坐标分析(principal coordinate analysis). 数量分类学原理和方法1-5 一·数量分类的基本概念 (二)分类分析 3、判别分析 所谓判别分析是在已对若干样本划分类群的基础上,根据某一OUT的性状综合判别它应置于哪个类群之中。 常用方法有距离判别(distance discriminatory)、贝叶斯判别( Bayes discriminatory )等。 数量分类学原理和方法1-6 一·数量分类的基本概念 (二)分类分析 4、分类分析和统计分析的区别 不是随机样本 不随机取样 数量分类学原理和方法1-7 一·数量分类的基本概念 (二)分类分析 5、数量分类学的优点 (1)具有综合多种来源数据的能力; (2)大部分分类过程自动化,效能大为提高; (3)以数值形式编码,便于电子化管理和交流; (4)因为方法是定量的,故可提供更大示差判别且在划分类元上更为灵敏; (5)使用更多更好的性状,改善了常规分类质量; (6)是对分类学原理和分类目的的重新审查; (7)其研究结果导致了若干生物学概念的重新解释。 数量分类学原理和方法2-1 二·性状的选取与量化 (一)性状选取的原则 1、初选性状应尽可能地广泛采用各方面的信息; 2、复选时,首先从初选性状中删掉无意义的性状; 3、删除不稳定和极稳定的性状; 4、对性状的相关性进行分析,删除逻辑相关性状和无意义的经验相关性状; 5、考虑性状选取的难易程度,及实验的可重复性。 从生物学的观察记录直接得到的性状称为基本性状(fundamental character),从基本性状利用数学方法间接得到的性状称为导出性状(induced character)。 数量分类学原理和方法2-2 二·性状的选取与量化 (二)性状编码 1、编码类型 1)二态性状 2)定量多态性状(连续性状) 3)定性多态性状 (1)有序多态性状 (2)无序多态性状
显示全部
相似文档