统计学7-方差分析.ppt
方差分析;引论;什么是方差分析?
(例题分析);什么是方差分析(ANOVA)?
(analysisofvariance);什么是方差分析?;方差分析中的有关术语;方差分析的根本思想和原理
(图形分析);从散点图上可以看出
不同行业被投诉的次数是有明显差异的
同一个行业,不同企业被投诉的次数也明显不同
家电制造被投诉的次数较高,
航空公司被投诉的次数较低。
行业与被投诉次数之间有一定的关系
如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上所呈现的模式也就应该很接近;仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异
这种差异也可能是由于抽样的随机性所造成的
需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析
所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时那么需要借助于方差
这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源;比较两类误差,以检验均值是否相等
比较的根底是方差比
如果系统(处理)误差明显地不同于随机误差,那么均值就是不相等的;反之,均值就是相等的
误差是由各局部的误差占总误差的比例来测度的;方差分析的根本思想和原理
(两类误差);方差分析的根本思想和原理
(两类方差);方差分析的根本思想和原理
(方差的比较);方差分析的根本假定;方差分析中的根本假定;方差分析中根本假定;方差分析中根本假定;问题的一般提法;;单因素方差分析的数据结构
(one-wayanalysisofvariance);分析步骤:提出假设;分析步骤:构造检验的统计量
(计算水平的均值);构造检验的统计量
(计算全部观察值的总均值);构造检验的统计量
(例题分析);构造检验的统计量
(计算总误差平方和SST);构造检验的统计量
(三个平方和的关系);构造检验的统计量
(计算均方MS);构造检验的统计量
(计算检验统计量F);构造检验的统计量
(F分布与拒绝域);统计决策;单因素方差分析表
(根本结构);单因素方差分析
(例题分析);关系强度的测量;关系强度的测量;关系强度的测量
(例题分析);用Excel进行方差分析
(Excel检验步骤);方差分析总结;3.从而,方差分析的本质是?
检验多个总体〔来自不同类别〕的均值是否相等〔统计意义上的相等,要排除随机性误差〕
4.如何实现检验?
通过分析方差来实现,具体说,是将总的方差分成两局部:组内方差〔仅仅包含随机误差-SSE〕和组间方差〔包含随机误差和由于类别带来的系统误差-SSA〕;5.组内方差与组间方差的关系?
1〕如果各类别的均值没有差异,那么系统性误差接近于0,从而:组间方差/组内方差约等于1.
2〕如果组间方差/组内方差大于1,那么类别带来了系统性误差〔即各类别的均值不相等〕,从而,类别变量对数值型变量有影响。
思考1:组间方差/组内方差有没有可能小于1?〔从公式判断〕
思考2:上述比值超出1多少,我们认为有显著影响?
;6.如何考虑组间方差/组内方差的比值?
我们知道,方差的大小和数据〔观察值〕的个数有关,因此,要排除数据个数对方差的影响,从而需要计算均方〔MS),计算均方的方式是用总方差除以自由度。除以自由度以后的统计量服从F分布,根据F分布我们就可以判断F值多大时对应的概率是多少,从而做出判断,这种影响是否是显著的。;7.如果两个变量有关系,如何度量两者的关系强度?R为度量值〔0-1之间〕
;双因素方差分析
(例题分析)