数学建模-判别分析概要.ppt
文本预览下载声明
* * 数学建模 判别分析 * * 判别分析的基本理论 距离判别 Bayes判别 上机实现 判别分析 * * 目录 上页 下页 返回 结束 判别分析 回归模型普及性的基础在于用它去预测和解释度量(metric)变量。但是对于非度量(nonmetric)变量,多元回归不适合解决此类问题。本章介绍的判别分析来解决被解释变量是非度量变量的情形。在这种情况下,人们对于预测和解释影响一个对象所属类别的关系感兴趣,比如为什么某人是或者不是消费者,一家公司成功还是破产等。 判别分析在主要目的是识别一个个体所属类别的情况下有着广泛的应用。潜在的应用包括预测新产品的成功或失败、决定一个学生是否被录取、按职业兴趣对学生分组、确定某人信用风险的种类、或者预测一个公司是否成功。在每种情况下,将对象进行分组,并且要求使用这两种方法中的一种可以通过人们选择的解释变量来预测或者解释每个对象的所属类别。 * * 目录 上页 下页 返回 结束 判别分析的基本理论 有时会遇到包含属性被解释变量和几个度量解释变量的问题,这时需要选择一种合适的分析方法。比如,我们希望区分好和差的信用风险。如果有信用风险的度量指标,就可以使用多元回归。但我们可能仅能判断某人是在好的或者差的一类,这就不是多元回归分析所要求的度量类型。 当被解释变量是属性变量而解释变量是度量变量时,判别分析是合适的统计分析方法。 判别分析能够解决两组或者更多组的情况。 当包含两组时,称作两组判别分析。当包含三组或者三组以上时,称作多组判别分析(Multiple discriminant analysis)。 判别分析的假设条件 判别分析最基本的要求是,分组类型在两组以上;在第一阶段工作是每组案例的规模必须至少在一个以上。解释变量必须是可测量的,才能够计算其平均值和方差,使其能合理地应用于统计函数。 * * 目录 上页 下页 返回 结束 判别分析的基本理论 判别分析的假设之一,是每一个判别变量(解释变量)不能是其他判别变量的线性组合。即不存在多重共线性问题。 判别分析的假设之二,是各组变量的协方差矩阵相等。判别分析最简单和最常用的形式是采用线性判别函数,它们是判别变量的简单线性组合。在各组协方差矩阵相等的假设条件下,可以使用很简单的公式来计算判别函数和进行显著性检验。 判别分析的假设之三,是各判别变量之间具有多元正态分布,即每个变量对于所有其他变量的固定值有正态分布。在这种条件下可以精确计算显著性检验值和分组归属的概率。当违背该假设时,计算的概率将非常不准确。 * * 距离判别 目录 上页 下页 返回 结束 两总体情况 * 中国人民大学六西格玛质量管理研究中心 * 距离判别 目录 上页 下页 返回 结束 * * 距离判别 目录 上页 下页 返回 结束 * * 距离判别 目录 上页 下页 返回 结束 * * 距离判别 目录 上页 下页 返回 结束 * * 距离判别 目录 上页 下页 返回 结束 多总体情况 1. 协差阵相同。 * * 距离判别 目录 上页 下页 返回 结束 2. 协差阵不相同。 * * 距离判别 目录 上页 下页 返回 结束 * * 距离判别 目录 上页 下页 返回 结束 * * Bayes判别 目录 上页 下页 返回 结束 贝叶斯(Bayes)统计的思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯思想用于判别分析,就得到贝叶斯判别。 * 中国人民大学六西格玛质量管理研究中心 * Bayes判别 目录 上页 下页 返回 结束 SAS系统中的判别分析过程主要有三个,分别是DISCRIM过程(一般判别过程)、CANDISC过程(典型判别分析)和STEPDISC过程(逐步判别过程)。其中一般判别过程主要基于马氏距离导出判别函数。 PROC DISCRIM过程 DISCRIM过程的一般格式 proc discrim options; class variable; id variable; by variables; freq variable; var variables; priors probabilities; run; 数据集选项 data=sas-data-set:指定输入的数据集 testdata=sas-data-set:指定欲进行分类
显示全部