第三讲信度难度区分度.ppt
第1页,共35页,星期日,2025年,2月5日§3.1测验的信度一、信度的定义二、信度系数的计算三、提高测验信度的途径第2页,共35页,星期日,2025年,2月5日任何一种测量都必然会存在误差。误差是不可避免的,可以分两种:随机误差:是由一些偶然因素引起的误差。比如一个考生在测验的得分,他的心情好与不好时测验得分会不一样,这种误差就叫随机误差。系统误差:是指与测量目的无关的因素引起的误差,如考生的阅读理解能力会对他的数学成绩产生影响。物理测验中含有与物理知识无关的数学内容等等,都会他的成绩,这种误差就称为系统误差。系统误差一般的表现是稳定的,不变的。测验成绩中包含有这两种误差,它是以测验分数的形式出现的。如何区分包含在测验分数中的这两种误差呢?在经典测量理论中,对这两种误差的主要是用信度与效度来进行描述的。第3页,共35页,星期日,2025年,2月5日在介绍信度与效度的概念前,我们需要了解测量的真分数理论。真分数为了研究方便,心理学家引入了真分数的概念。真分数即是测量中不存在测量误差时的真值或客观值,操作定义就是无数次测量结果的平均值,在实际的测量中,误差是不可避免的,当测量结果接近于真分数时,我们就说误差较小。通常用XT表示真分数。数学模型观察分数用X表示,XT、XSE表示测量误差,则真分数的基本方程式为:X=XT+XSE。这里的误差只包括随机误差,系统误差是包含在真分数里的。第4页,共35页,星期日,2025年,2月5日假设根据公式我们可推导出三个相互关联的假设公理:第一,反复观察N次,误差平均数为零,即真分数等于实得分数的平均数XT=E(X)或E(XSE)=0.第二,真分数和测量误差之间相互独立。ρ(XT,XSE)=0第三,各平行测验误差相关为零。ρ(XSE1,XSE2)=0在实际应用当中,用平行测验反复测量同一个人的同一心理特质是行不通的,因为平行测验不仅要求所测特质相同,对题目、数量、难度、区分度等也要保持一致性。这就增加了编制方面的困难。一般我们都是用同一个测验测量一个团体,团体中的每个人的误差可以假定是随机,并服从正态分布。所测团体的实测分数、真分数和误差分数的方差之间有如下的关系,第5页,共35页,星期日,2025年,2月5日测验的信度是指测验结果的可靠性或可靠程度。可靠性是指对同一组对象进行两次相同测量所得结果的一致性和稳定性程度。一、信度的定义测量学中,信度可定义为真分数方差与实得分数方差的比率,即(3.1.1)这表明,真分数方差在实得分数方差中所占的比重越大,则信度就越高。由于是未知数,所以根据误差方程可将公式(3.1.1)改写为(3.1.2)而和都可以从一组实得分数中计算出来,所以(3.1.2)式更有实际意第6页,共35页,星期日,2025年,2月5日从公式(3.1.1)或(3.1.2)看出,若真分数T与实得分X接近时,和也会接近,而误差及就会很小,此时信度就会增大。可见,信度是实测值与真值之间差距大小的量度。测验信度越高,误差就越小,测验的结果也越可靠。理想情况下,误差为零时,信度达到最大值;当信度很低,甚至降为零时,表明测验分数中充满误差,它比不测验还糟。信度的值在(0~1)之间,称为信度系数。当为0.95~0.99时,测验可靠性很高,但不常见;为0.9~0.94是通常能得到的最好结果;为0.8~0.9也比较好;为0.7~0.79尚可使用,在0.7以下,表明误差太大,该测验不能使用。第7页,共35页,星期日,2025年,2月5日实际工作中,通过对测验结果的一致性程度来计算信度的,主要有三种:稳定性系数、等值性系数和内在一致性系数。1、稳定性系数(再测信度)用同一个测验,对同一组考生前后两次进行测验,两次测验分数的相关系数为再测信度.因为它能反映两次测验结果的一致性