文档详情

统计实验(判别分析)..doc

发布:2017-01-18约4.08千字共5页下载文档
文本预览下载声明
实验二 判别分析 1.实验目的: 本实验讨论利用判别分析将待判样品进行归类的问题。通过该实验,能够起到如下的效果:(1) 理解判别分析的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用判别分析,提出问题、分析问题、解决问题、得出结论; (3)会调用SAS软件实现判别分析的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。 2.知识准备: 判别分析是要把待判样品按与已知类别的相近程度进行归类。其思想是:先给出与已知类别相近程度的量化标准,然后按照该标准,计算待判样品与已知类别的相近程度,将待判样品归入最接近的类别。相近程度的量化标准有很多种,如:距离判别法、费歇尔判别法、贝叶斯判别法、逐步判别法等,它们的数学表述各不相同。判别分析步骤大体分为(以贝叶斯判别法为例):首先由已知类别的数据(也称为训练样本的数据)根据贝叶斯公式计算出后验概率;然后结合损失函数得到判别函数,以判别函数的取值作为与已知类别相近程度的量化标准(函数值越大表示越相近);接着把训练样本的数据反代回判别函数,计算出其函数值,重新判断它们的类别(称回判类别),得到与原始类别不同的比例(误判率),以判断该方法是否有效(回判的方法还可采用交叉回判法,其思想是回判某个训练样品时,暂时将它作为待判样品,把它从训练样品中去掉,重新计算判别函数,然后判断该样品的类别);最后把待判样品的数据代入判别函数,算出函数值,将待判样品归入最相近的类别。 3.实验内容: 表1 人生三大要素指标数据 序 国家 X1 X2 X3 类 1 美国 76 99 5374 1 2 日本 79.5 99 5359 1 3 瑞士 78 99 5372 1 4 阿根廷 72.1 95.9 5242 1 5 阿联酋 73.8 77.7 5370 1 6 保加利亚 71.2 93 4250 2 7 古巴 75.3 94.9 3412 2 8 巴拉圭 70 91.2 3390 2 9 格鲁吉亚 72.8 99 2300 2 10 南非 62.9 80.6 3799 2 1 中国 68.5 79.3 1950 2 罗马尼亚 69.9 96.9 2840 3 希腊 77.6 93.8 5233 4 哥伦比亚 69.3 90.3 5158 人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指标采用X1-出生时的预期寿命、X2-成人识字率X3-实际人均GDP,将以上三个指标的数字合成一个复合指数,即为人文发展指数。 今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为样品,另选4个国家作为待判样品。贝叶斯判别分析【1】ata human1; input no X1 X2 X3 type; label X1=A X2=B X3=C; cards; 1 76 99 5374 1 2 79.5 99 5359 1 3 78 99 5372 1 4 72.1 95.9 5242 1 5 73.8 77.7 5370 1 6 71.2 93 4250 2 7 75.3 94.9 3412 2 8 70 91.2 3390 2 9 72.8 99 2300 2 10 62.9 80.6 3799 2 ; run; Data human2; input no X1 X2 X3; label X1=A X2=B X3=C; cards; 1 68.5 79.3 1950 2 69.9 96.9 2840 3 77.6 93.8 5233 4 69.3 90.3 5158 ; run; Proc discrim data=human1 testdata=human2 crosslisterr testlist; class type; var X1-X3; run; 语句解释: “Data humanl;”指将数据输入到文件“humanl”中; “input no X1 X2 X3 type;”指将后面数据对应地赋予
显示全部
相似文档