讲统计分析.ppt
文本预览下载声明
频次分布 集中趋势 离中趋势 相关分析 统计检验 数据分析就是运用统计学方法对调查得到的数据资料进行定量分析,以揭示事物内在数量关系、规律和发展趋势的一种资料分析方法。 统计分析的作用 为研究提供一种清晰精确的形式化语言 统计分析是进行可惜预测、探索未来的重要方法。 对变量之间的关系进行深入探索 常用的数据分析 频次分布 频率即某一事件的次数与总事件数目之商。常用比例或百分数来表示 百分数的用途 说明发生某现象或具有某种特征的团体占总体的份额 对份额做比较 作为从样本推算整体的依据 说明增长或减少的份额 说明增长或下降的速度 注意: 在总体较小的情况下,对百分数的比较和说明是没有意义的 对百分数进行比较时必须要考虑到集数的大小 不能简单地依据表面值的大小来做出结论 次数分布表 简单的次数分布表 例:某公司进行的商品评价中有一题为“请问您对本产品的口味的满意程度如何”,1为非常满意;2为比较满意;3为一般;4为不太满意;5为非常不满意。共有80名顾客参与了调查,依选项顺序分别是9、30、10、25、6,试制作一个简单次数分布表。 分组次数分布表 例:50名学生参加某次考试的成绩 求全距 全距=最大值-最小值 决定组数和组距 一般在5~15之间 数据个数 在100以上,一般取12~16组 数据个数较少,则取7~9组 一般来说,分组越多,组距越小,计算越精确,但要求总的数据量越大 分组少,组距大,计算简单,但误差较大 决定组限 最大组与最小组区间应包括两端的极端值 最高组或最低组的下限最好是组距的整数倍 数据登记与计算次数 编制次数分布表 Spss运用实例 次数分布表的意义 优点:将杂乱无章的数据排列程序 显示一组数据的集中情况 缺点:存在计算误差 集中趋势 表示一组数据的中心位置的数据点在什么地方 算术平均数、中数、众数 算术平均数 算术平均数的优缺点: 优点: 反应灵敏 计算严密 计算简单 简明易解 适合于进一步用代数方法计算 较少受抽样变动的影响 缺点: 易受极端数据的影响 若出现模糊不清的数据时,无法计算平均数 中数 位于一组数据中较大的一半与较小的一半中间位置的那个数。 能描述一组数据的典型情况 未分组 单列奇数 单列偶数 重复数据 奇数组: 偶数组 分组数据的中数 中数的优点: 计算简单,容易理解 不足: 大小与全体数据无关 不够灵敏 受抽样影响较大 中数的使用: 个别数据模糊不清时宜使用中数 当出现极端数据时或仅知道分组的次数分布 要快速估计一组数据时 众数:数据中出现次数最多的那个变量值 不是唯一的 适合于描述性研究和定类、定序的尺度 众数的优点: 概念简单明了,容易理解 缺点: 不稳定,受分组影响,也受样本变动影响 平均数、中数和众数三者之间的关系 正态分布情况下,三者相等 偏态情况下 加权平均数 几何平均数 几何平均数的应用——平均增长率的计算 离中趋势 极差(全距) 极差=最大值-最小值 反映了一组数据的最大离散值 平均差 5名顾客对某产品的评价数据如下,求其平均差。 平均差是一组数据中的各数据对平均数的离差绝对值的平均数 反映了次数分布的离散程度 平均差越大,数据之间的变异程度越大 四分差 一个次数分配中,中间50%数据的次数为全距的一半 反映了数据分布中中间50%数据的散布情况 方差与标准差 方差与标准差的意义 方差反映的是一组数据对其以均值为代表的中心的某种偏离程度 是表示一组数据离散程度的最好指标 方差越大,离散程度越大 优点: 反应灵敏 计算公式严密 便于计算 适合代数运算 受抽样变动影响小 简单明了 标准差的应用: 偏离系数 群体1:均值50,标准差15 群体2:均值60,标准差30 例:调查显示,某城市居民每月人均用在食品上的费用420元,标准差为35元;用在通讯上的费用为135元,标准差45元,问居民在那个方面上的费用离散程度更高? 练习: 2004年某校英语四六级考试成绩: 四级的平均成绩525,标准差105; 六级平均成绩500,标准差200; 2007年的情况为: 四级平均成绩550,标准差110; 六级平均成绩520,标准差200 标准分数:表示一个分数在团体中所处位置的量数。 相关系数 相关系数是度量两个变量之间相互联系程度的统计量 用r表示 取值介于-1~1之间 注意事项: 相关系数不是等距的度量值 相关仅说明两变量间具有共变关系,但并不一定是因果关系 判断两变量间是否真的相关还要考虑所抽取的样本 统计检验 T检验 检验两变量的平均数之间的差异 F检验 用于方差的差异检验 λ2检验 例:某市场调查小组在8个省区进行调查,各省区的取样人数及平均分数如下: 665 3800 合计 98 60 82 96 80 65 96 88 627
显示全部