概率论与数理统计假设检验的概念.pptx
第八章假设检验
假设检验的基本概念§8.1若对参数有所了解但有怀疑猜测需要证实之时用假设检验的方法来处理若对参数一无所知用参数估计的方法处理
§8.1假设检验的基本思想与概念假设检验问题引例某厂生产的合金强度服从,其中的设计值?为不低于110(Pa)。为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa)。某天从生产中随机抽取25块合金,测得强度值为x1,x2,…,x25,其均值为(Pa),问当日生产是否正常?
(1)是参数估计问题吗?(2)回答“是”还是“否”,假设检验问题。(3)命题“合金平均强度不低于110Pa”正确与否仅涉及如下两个参数集合:这两个非空参数集合都称作统计假设,简称假设。(4)我们的任务是利用样本去判断假设(命题)“”是否成立。这里的“判断”在统计学中称为检验或检验法则。
在假设检验中,常把一个被检验的假设称为原假设,用表示,通常将不应轻易加以否定的假设作为原假设。当被拒绝时而接收的假设称为备择假设,用表示,它们常常成对出现。01在上例中,我们可建立如下两个假设:01一、建立假设假设检验的基本步骤
二、选择检验统计量,给出拒绝域形式由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域,一般用W表示,在上例中,样本均值愈大,意味着总体均值?也大,因此,合理的拒绝域形如
正如在数学上我们不能用一个例子去证明一个结论一样,用一个样本(例子)不能证明一个命题(假设)是成立的,但可以用一个例子(样本)推翻一个命题。因此,从逻辑上看,注重拒绝域是适当的。事实上,在“拒绝原假设”和“拒绝备择假设(从而接收原假设)”之间还有一个模糊域,如今我们把它并入接收域,所以接收域是复杂的,将之称为保留域也许更恰当,但习惯上已把它称为接收域,没有必要再进行改变,只是应注意它的含义。
从而拒绝原假设,这种错误称为第一类错误,其发生的概率称为犯第一类错误的概率,或称拒真概率,通常记为其一是为真但样本观测值落在拒绝域中,01在接受域中,从而接受原假设,这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率,或称采伪概率,通常记为。由于检验法则是根据样本做出的,所以检验可能犯以下两类错误:其二是不真(即为真)但样本观测值落02三、选择显著性水平
观测数据情况总体情况犯第一类错误正确正确犯第二类错误为真为真
当?减小时,必导致?的增大;当?减小时,必导致?的增大;说明:在样本量一定的条件下不可能找到一个使?和?都小的检验。英国统计学家Neyman和Pearson提出水平为?的显著性检验的概念。显著性检验:控制第一类错误,让它不大于;而不考虑第二类错误概率。数称之为显著性水平。
确定显著性水平后,可以定出检验的拒绝域W。在上例,若取?=0.05,若令则拒绝域有一种表示:四、给出拒绝域
五、作出判断在有了明确的拒绝域后,根据样本观测值我们可以做出判断:当时,则拒绝即接收;当时,则接收在上例中,由于因此拒绝原假设,即认为该日生产不正常。
知识总结及例题假设检验的内容参数检验非参数检验总体均值,均值差的检验总体方差,方差比的检验分布拟合检验符号检验秩和检验
假设检验的理论依据通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓实际推断原理:“一个小概率事件在一次试验中几乎是不可能发生的”.假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”
”实例某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5千克,标准差为0.015千克.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(千克):4970.5060.5180.5240.4980.5110.5200.5150.512,问机器是否正常?分析:
02再利用已知样本作出判断是接受假设H0(拒绝假设H1),还是拒绝假设H0(接受假设H1).如果作出的判断是接受H0,即认为机器工作是正常的,否则,认为是不正常的.提出两个对立假设由