社会统计学之方差分析与试验设计.ppt
文本预览下载声明
第 6章 方差分析与试验设计 第 6章 方差分析与试验设计 1 方差分析引论 2 单因素方差分析 3 方差分析中的多重比较 4 双因素方差分析 5 试验设计初步 学习目标 解释方差分析的概念 解释方差分析的基本思想和原理 掌握单因素方差分析的方法及应用 理解多重比较的意义 掌握双因素方差分析的方法及应用 掌握试验设计的基本原理和方法 失业保险案例:为什么要进行方差分析? 要研究的问题 各个总体的均值相等吗? 失业保险案例:实验结果…… 1=无奖金 2=低奖金 3=中奖金 4=高奖金。根据实验结果,可以认为各总体的平均失业时间相同吗? 研究方法:两样本的t检验? 用t检验比较两个均值: 每次只能比较两个均值,要解决上述问题需要进行6次t检验…… 在整体检验中犯第一类错误的概率显著增加:如果在每次t检验中犯第一类错误的概率等于5%,则在整体检验中等于1-(1-0.05)6=0.2649 方差分析可以用来比较多个均值 方差分析(Analysis of variance,ANOVA)的主要目的是通过对方差的比较来检验多个均值之间差异的显著性。 可以看作t检验的扩展,只比较两个均值时与t检验等价。 20世纪20年代由英国统计学家费喧(R. A. Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。 为什么不做两两比较? 设有四个总体的均值分别为m1 、 m2、m3 、 m4 ,要检验四个总体的均值是否相等,每次检验两个的作法共需要进行6次不同的检验,每次检验犯第一类错误的概率为?,连续作6次检验犯第Ⅰ类错误的概率增加到1-(1-?)6=0.265,大于0.05。相应的置信水平会降低到0.956=0.735 一般来说,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加,(并非均值真的存在差别) 方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设 方差分析及其有关术语 什么是方差分析(ANOVA)?(analysis of variance) 检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类 一个数值型因变量 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量 什么是方差分析? (例题分析) 什么是方差分析? (例题分析) 分析4个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响 作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等 若它们的均值相等,则意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;若均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异 方差分析中的有关术语 因素或因子(factor) 所要检验的对象 分析行业对投诉次数的影响,行业是要检验的因子 水平或处理(treatment) 因子的不同表现 零售业、旅游业、航空公司、家电制造业 观察值 在每个因素水平下得到的样本数据 每个行业被投诉的次数 方差分析中的有关术语 试验 这里只涉及一个因素,因此称为单因素4水平的试验 总体 因素的每一个水平可以看作是一个总体 零售业、旅游业、航空公司、家电制造业是4个总体 样本数据 被投诉次数可以看作是从这4个总体中抽取的样本数据 1. 因变量:我们实际测量的、作为结果的变量,例如失业持续时间。 2. 自变量:作为原因的、把观测结果分成几个组以进行比较的变量例如奖金水平。 在方差分析中,自变量也被称为因素(factor)。 因素的不同表现,即每个自变量的不同取值称为因素的水平或处理(treatment)。 3. 观察值 在每个因素水平下得到的样本数据 每种奖金水平下的失业时间就是观察值 试验 这里只涉及一个因素,因此称为单因素四水平的试验 总体 因素的每一个水平可以看作是一个总体 比如4种奖金水平可以看作是四个总体 样本数据 失业时间可以看作是从这四个总体中抽取的样本数据 方差分析主要用来研究一个定量因变量与一个或多个定性自变量的关系 只有一个自变量的方差分析称为单因素方差分析。 研究多个因素对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。 固定效应模型:因素的所有水平都是由实验者审慎安排而不是随机选择的。 随机效应模型:因素的水平是从多个可能的水平中随机选择的。 固定效应和随机效应模型在假设的设置和参数估计上有所差异,本章研究的都是固定效应模型。 方差分析与回归分析的联
显示全部