05第五节分布拟和检验.doc
文本预览下载声明
第五节 分布拟合检验
本章前四节所介绍的各种检验法, 是在总体分布类型已知的情况下, 对其中的未知参数进行检验, 这类统计检验法统称为参数检验. 在实际问题中, 有时我们并不能确切预知总体服从何种分布, 这时就需要根据来自总体的样本对总体的分布进行推断, 以判断总体服从何种分布. 这类统计检验称为非参数检验. 解决这类问题的工具之一是英国统计学家K. 皮尔逊在1900年发表的一篇文章中引进的——检验法,不少人把此项工作视为近代统计学的开端。
分布图示
★ 引言 ★ 引例
★ 检验法的基本思想
★ 检验法的基本原理和步骤
★ 检验法-总体含未知参数的情形
★ 例1 ★ 例2 ★ 例3
★ 例4 ★ 例5
★ 内容小结 ★ 课堂练习
★ 习题7-5
内容要点
一、引例
例如, 从1500到1931年的432年间, 每年爆发战争的次数可以看作一个随即变量, 据统计, 这432年间共爆发了299次战争, 具体数据如下:
战争次数X 发生X次战争的年数 0 223 1 142 2 48 3 15 4 4 根据所学知识和经验, 每年爆发战争的次数X, 可以用一个泊松随机变量来近似描述, 即可以假设每年爆发战争次数分布X近似泊松分布. 于是问题归结为:如何利用上述数据检验X服从泊松分布的假设.
二、检验法的基本思想
检验法是在总体X的分布未知时, 根据来自总体的样本, 检验总体分布的假设的一种检验方法. 具体进行检验时,先提出原假设:
: 总体X的分布函数为
然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.
这种检验通常称作拟合优度检验. 它是一种非参数检验. 一般地, 我们总是根据样本观察值用直方图和经验分布函数, 推断出总体可能服从的分布, 然后作检验.
三、检验法的基本原理和步骤
1) 提出原假设:
:总体X的分布函数为
如果总体分布为离散型, 则假设具体为
:总体X的分布律为
如果总体分布为连续型, 则假设具体为
:总体X的概率密度函数
2) 将总体X的取值范围分成k个互不相交的小区间, 记为,如可取为
其中可取,可取;区间的划分视具体情况而定,使每个小区间所含样本值个数不小于5,而区间个数不要太大也不要太小;
3) 把落入第个小区间的样本值的个数记作,称为组频数,所有组频数之和等于样本容量;
4) 当为真时,根据所假设的总体理论分布,可算出总
体X的值落入第个小区间的概率, 于是就是落入第个小区间的样本值的理论频数.
5) 当为真时, 次试验中样本值落入第个小区间的频率与概率应很接近, 当不真时, 则与相差较大. 基于这种思想, 皮尔逊引进如下检验统计量 并证明了下列结论.
定理1 当n充分大时, 则统计量近似服从分布.
根据该定理, 对给定的显著性水平, 确定值, 使
,
查分布表得, 所以拒绝域为
若由所给的样本值算得统计量的实测值落入拒绝域, 则拒绝原假设, 否则就认为差异不显著而接受原假设.
四、总体含未知参数的情形
在对总体分布的假设检验中, 有时只知道总体X的分布函数的形式, 但其中还含有未知参数, 即分布函数为
其中为未知参数. 设是取自总体X的样本, 现要用此样本来检验假设:
:总体X的分布函数为
此类情况可按如下步骤进行检验:
1) 利用样本,求出的最大似然估计,
2) 在中用代替则就变成完全已知的分布函数
3) 计算时, 利用 计算的估计值
4) 计算要检验的统计量
,
当n充分大时,统计量近似服从分布;
5) 对给定的显著性水平, 得拒绝域
注: 在使用皮尔逊检验法时,要求,以及每个理论频数,否则应适当地合并相邻的小区间,使满足要求.
例题选讲
例1(E01) 将一颗骰子掷120次, 所得数据见下表
问这颗骰子是否均匀、对称 (取)?
解 若这颗骰子是均匀的、对称的, 则1~6点中每点出现的可能性相同, 都为1/6. 如果用表示第点出现 则待检假设
在成立的条件下, 理论概率 由得频率
计算结果如下表.
1 23 1/6 20 9/20 2 26 1/6 20 36/20 3 21 1/6 20 1/20 4 20 1/6 20 0 5 15 1/6 20 25/20 6 15 1/6 20 25/20 合计 120 4.8 因此分布不含未知参数, 又 查表得
由上表, 知 故接受 认为这颗骰子是均匀对称的.
例2 (E02) 检验引例中对战争次数提出的假设: X服从参数为的泊松分布.
根
显示全部