第五章假设检验解析.ppt
文本预览下载声明
思考:统计上的“显著”指什么? 在假设检验中,拒绝原假设则称样本结果在“统计上是显著的”,“显著的”含义在于“非偶然的”,表示这次抽样得到的样本结果不是偶然的也就是非小概率的。 * * 由假设检验的目的引出的两类错误 假设检验的目的 根据样本信息做出决策,并且希望是正确的决策 那么,如果决策出现错误,你认为会是怎样的错误? 第一类错误(弃真错误) 原假设为真时拒绝原假设 即检验统计量落入拒绝域 犯第一类错误的概率为?,即显著性水平 (1- ? )则置信水平 第二类错误(取伪错误) 原假设为假时没有拒绝原假设 第二类错误的概率为??(Beta) The power of the test is (1-?) 两类错误之间的关系 我们更看重哪个错误? 为什么? 例析 USA Today报导在美国非法赌博的金额至少平均每人每年$200,你觉得这个数字太过于夸张,因此找了n个人的样本来估计每年非法赌博的平均金额。你想要检验的假设为: H0:μ≧$200 H1:μ $200 假设真正的总体均值为$200,如果你估计的样本平均远低于$200,则你会推翻正确的假设,从而而犯下型I错误 如果实际非法赌博的金额远低于$200,即H0并不正确,但你运气欠佳,得到的样本估计的均值十分接近200,则你应该推翻H0。但样本数据却不足以推翻错误的假设,此时你犯了型II的错误 检验的工具----检验统计量 检验统计量 根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 假设H0为真 点估计量的抽样分布 标准化的检验统计量 拒绝域(发生小概率事件的区域) 根据显著性水平,我们可以将检验统计量分成穷尽及互斥的两组数值区域: The rejection region (拒绝域) The non rejection region (无法拒绝域) 临界值是区分拒绝域及无法拒绝域的界线。 做出决策的依据----临界值和拒绝域法 统计决策 将检验统计量的值与? 水平的临界值进行比较,给定显著性水平?,查表得出相应的临界值z?或z?/2, t?或t?/2 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 -临界值,拒绝H0 右侧检验:统计量 临界值,拒绝H0 做出决策的依据----P值法 P 值(P-value)的缘起 在假设检定中,我们通常会事先决定显著水平α,然后根据决定之后的α值找出拒绝域及接受域 但在很多的情况下,我们无法预估type I 错误及type II错误的成本,因此无法确定合意的α值。所以有时候我们直接指出得到观察统计量的概率 P 值 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 被称为观察到( the observed significant level)的显著性水平 P-value 告诉我们:「如果零假设为真,我们观察到目前数据显示的检验统计量的概率有多高?」如果这个概率很小,则我们可以拒绝零假设,因为如果假设为真,则仅有很小的概率抽取任意的随机样本会得到目前的观察值 P-value是不仅止于告诉我们在某一显著水平下是否拒绝H0,如果我们知道P-value = .002则我们知道H0不但在.05的显著水平下会被拒绝,在.005的水平下也会被拒绝 如果仅知道P-value =.04,则是否拒绝H0可以由读者来决定,如果某一研究人员决得.01才算显著,则H0不会被拒绝,如果将显著水平置于.05,则拒绝 一般在研究报告中,研究者经常直接写出p-value而让读者自己去决定是否要拒绝H0 一些证据:P〈.010 适度证据:P〈.005 很强证据:P〈.001
显示全部