第五章假设检验讲课.ppt
文本预览下载声明
? 错误和 ? 错误的关系 ? ? 你不能同时减少两类错误! ?和?的关系就像翘翘板,?小?就大, ?大?就小 五. 统计假设检验中的P值 1. P的含义 P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。 1、利用P 值进行决策 (1)单侧检验:若p值 ?,不拒绝H0;若p值 ?, 拒绝H0。 (2)双侧检验:若p值 ?/2, 不拒绝H0;若p值 ?/2, 拒绝H0。 (在计算机软件中,通常只比较P同? 的关系) 2、P 值检验法的优点 (1)结论对任何统计量均适用,不需要改变。 (2)在改变显著性水平时,无须重新计算p值。( ?临界值法需要重新计算临界值。) 3、P 值法与小概率原理: p值 ?,表明小概率事件发生了,根据小概率原理(小概率事件在一次中是不可能发生的,如果发生了,则认为其是假的),因此认为原假设是假的假设,应拒绝原假设。 用女生节来理解“假设检验” 女神万人迷有着众多追求者,可是她却迟迟未收到任何人的表白,于是她心急了,打算在女生节这天,从与她接触过的所有男生中,筛选出所有喜欢她的人。 她决定运用统计学的假设检验法来帮助她完成筛选。首先要建立原假设和备择假设,备择假设是由实验者的意图决定的,因为假设检验法收集证据的目的就是为了推翻原假设而接受备择假设。根据万人迷的意图,她是想找出喜欢她的人,所以: 备择假设为:该名男生喜欢她。 对立的,原假设就为:该名男生不喜欢她。 用女生节来理解“假设检验” 根据假设检验的思想,对于每一个样本,在进行判断之前,都先认为原假设是正确的,然后再根据所收集到的实验数据来判断是否推翻该原假设。 因此,对于每一个与万人迷接触过的男生,万人迷都是先假定对方是不喜欢她的。 建立完假设之后,就该收集实验数据了。万人迷认为,如果该名男生在她面前表现越好,那么就越有可能是喜欢她的。于是,在女生节那天,她对每一个接触过的男生的当天表现进行了评分(假定评分是客观公正的)。 用女生节来理解“假设检验” 在给所有男生评分完之后,万人迷将合格分数线定在80分以上,这称作拒绝域,也就是指,在基于该男生不喜欢她的这个原假设下,若该男生得分却达到了80分以上,那么该男生不喜欢她就不太可能了,所以就应该拒绝原假设接受备择假设,认为该男生是喜欢她的。 做完了这些,似乎就可以开始检验了,这真是一个激动人心的筛选过程。但是,善良的万人迷很快就停了下来,她想知道自己定的这个80分以上的标准线到底好不好,会不会犯错而误会别人。 的确,在假设检验中存在两种错误,一种是原假设是正确的,结果却拒绝了原假设,这称为第一类错误,另一种是备择假设是正确的,结果却没有拒绝原假设,这称为第二类错误。 用女生节来理解“假设检验” 第一类错误是指,该男生的确是不喜欢万人迷的,符合原假设,但是因为当天恰巧送了万人迷一份小礼物,而使得分恰好达到了80分以上的拒绝域,因而拒绝了原假设,认为该名男生是喜欢万人迷的。 第二类错误是指,该男生是喜欢万人迷的,符合备择假设,却因为某些意外情况而没有表现得足够好,而使分数恰好低于了80分,因而没有拒绝原假设,认为该名男生是不喜欢万人迷的。 得知存在这两种错误后,万人迷开始纠结了,她什么错误都不想犯,那么是否可以通过改变80分以上这个拒绝域,来同时减小犯两类错误的可能性呢? 用女生节来理解“假设检验” 当把拒绝域改为90分以上时,对于不喜欢万人迷的男生而言,即便存在某些偶然事件而获得较高得分,但得分能够达到90分以上的可能性必然要小一些,那么万人迷犯下的第一类错误的确是减少了。但是,对于那些喜欢万人迷的男生来说,由于某些偶然事件而没有表现得足够好,使得分数低于90分的可能性就变大了,因此万人迷犯下的第二类错误增多了。同理,把拒绝域定为70分以上,则第一类错误就增多,而第二类错误会减少。 那么万人迷应该更关注哪一类错误呢?在西方的思想观念中,任何一个被带上法庭的人,法官都要先假定他是无罪的,然后再寻找证据去证明他有罪,否则无罪,即宁愿放过一个坏人也不冤枉一个好人。这种观念在假设检验的思想中留下了烙印,先认为原假设是对的,绝不轻易“冤枉”原假设,即要限制犯第一类错误的可能性。 于是,就产生
显示全部