统计分析方法应用.ppt
文本预览下载声明
第五部分 统计分析-1 (三)变量分布特征的描述(统计分布的数值特征分析) 二、相关与回归分析 案例2 以下是浙江城镇居民2005年收入与消费分组资料,试进行收入与消费的相关回归分析? 判别两者是否有关? 相关的形式 前提:必须是在相关基础上进行 时间数列的类型 例 当存在长期趋势时,可用趋势剔除法计算季节比率。 选择评价指标 收集数据,并对数据进行同度量处理(标准化、功效系数、相对化处理) 确定不同指标的权重(专家法、层次分析、环比构权……) 选择综合的方法,计算综合评价指数或分值 根据指数或分值进行比较、排序、作出判断。 由聚类谱系图,29个地区可分四类: 第一类:{北京、上海、广东},生活质量好。 第二类:{浙江、天津},生活质量较好。 第三类:{河北、新疆、辽宁、贵州、安徽、海南、湖北、江苏、云南、福建、山东、湖南、广西、四川、重庆},生活质量一般。 第四类:{山西、宁夏、黑龙江、江西、吉林、河南、陕西、青海、甘肃},生活质量差。 重庆 四川 广西 湖南 山东 福建 云南 江苏 甘肃 青海 陕西 河南 吉林 江西 黑龙江 宁夏 山西 湖北 海南 安徽 贵州 辽宁 新疆 河北 浙江 天津 广东 上海 北京 Distance Between Cluster Centroids 0 1 2 29个地区可分为四类: 第一类:{北京、上海、广东},生活质量好。 第二类:{浙江、天津},生活质量较好。 第三类:{江苏、云南、福建、山东、湖南、广西、四川、重庆},生活质量一般。 第四类:{河北、新疆、辽宁、贵州、安徽、海南、湖北、山西、宁夏、黑龙江、江西、吉林、河南、陕西、青海、甘肃},生活质量差 29个地区可分为四类: 第一类:{北京、上海、广东},生活质量好。 第二类:{浙江、天津},生活质量较好。 第三类:{江苏、云南、福建、山东、湖南、广西、四川、重庆},生活质量一般。 第四类:{河北、新疆、辽宁、贵州、安徽、海南、湖北、山西、宁夏、黑龙江、江西、吉林、河南、陕西、青海、甘肃},生活质量差 对不同方法得到的结果进行综合,结合实际情况,29个地区城镇居民的生活质量分为五类比较合适: 第一类:{北京、上海、广东},生活质量好。 第二类:{浙江、天津},生活质量较好。 第三类:{江苏、云南、福建、山东、湖南、广西、四 川、重庆},生活质量一般。 第四类:{河北、新疆、辽宁、贵州、安徽、海南、湖北},生活质量较差。 第五类:{山西、宁夏、黑龙江、江西、吉林、河南、陕西、青海、甘肃},生活质量差。 基本思想 根据已知类别的样本所提供的信息,总结出分类的规律性,建立判别公式和判别准则,判别新的样本点所属类型,是判别个体所属群体的一种统计方法。 4、判别分析 判别分析 已知研究对象分为若干个类别,并且已 经取得每一类别的一批观测数据,在此基础上寻求出分类的规律性,建立判别准则,然后对未知类别的样品进行判别分类。 聚类分析 一批样品划分为几类事先并不知道,需要通过聚类分析来给以确定类型。 距离判别法案例 思路: 距离判别的最直观的想法是计算样品到第 i 类总体的距离,哪个距离最小就将它判归哪个总体。 所以,需要构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。 在企业的考核中,可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有: 资金利润率=利润总额/资金占用总额 劳动生产率=总产值/职工平均人数 产品净值率=净产值/总产值 三个指标的均值向量和协方差矩阵如下。 现有二个企业,观测值分别为(7.8,39.1,9.6)和(8.1,34.2,6.9),问这两个企业应该属于哪一类? 变量 均值向量 协方差矩阵 优秀 一般 资金利润率 13.5 5.4 68.39 40.24 21.41 劳动生产率 40.7 29.8 40.24 54.58 11.67 产品净值率 10.7 6.2 21.41 11.67 7.90 线性判别函数: 判别准则: 故属于优秀企业 故属于一般企业 五、其他统计分析方法 *统计综合评价 基本思想: 利用统计指标体系,采用特定的评价模型,对被评价对象多方面的数量表现(多个指标)进行高度的抽象和综合,并将它转化为综合评价值,进而确定现象优劣水平、类型、名次的统计方法。 基本步骤: 如何看待评价结果? 就业人数(万人)
显示全部