心理测量-信度与效度.pptx
文本预览下载声明
心 理 测 量信度与效度第二节 信度(reliability)一、定义1、信度是指测量的一致性程度,或者说是测验分数的可靠性 程度2、统计定义:X = T + E(1)信度是观测分数与真分数的相关(2)真分数的变异在观测变异中所占的比例(3)平行测验之间的相关二、信度的种类1、再测信度 同一测验对同一组被试的先后两次测量之间的相关2、复本信度 两个内容、结构相同的测验对同一组被试测量结果的相关3、分半信度4、克伦巴赫α系数(cronbach - α)和 库-理(Kuder-Richardson)信度5、评分者信度[例]被评者公式中K=3(评定者数) N=6(被评者数)一二三四五六A413526B234516C325416R961214418评定者三、影响信度的因素1、测验的长度2、测验分数的分布范围3、测验的难度4、测验题目的客观化程度四、信度系数与误差来源信度系数类型误差方差再测信度时间取样复本信度(即时)内容取样复本信度(延迟)时间取样和内容取样分半信度内容取样库-理信度和α系数内容取样和内容异质性评分者信度评分者之间差异五、测量的标准误差四、信度的特殊问题(一)速度测验的信度 没有完成测验的人数的百分比,可以作为判断一个测验是否是速度测验的依据。但要视具体情况而定。 一般来说,纯速度测验几乎不考虑难度因素,但如果难度与速度测验混在一起,就更难处理了。 纯速度测验可用复本法和再测法,指标是两次回答完题目的数量。 如果速度和难度混在一起,就将时间分为四等份,在每个时间点上要被试作记号,然后将一四时间段的题目合并,二三时间段的题目合并,再用分半相关法计算信度。 (二)标准参照测验的信度 作为心理与教育统计,都是以个别差异的模式为基础的,即适合常模参照测验。在教育测验种有很多是标准参照测验(掌握测验),统计方法还在探索中,还不成熟。一般以两次测验的通过率差异来判断,当然,前提是被试同质 (三)分测验的信度 整个测验信度高,不能说明各分测验的信度也高,要保证各分测验有高信度。 (四)差异信度(如语文与数学分数差异的稳定性) (五)变迁信度 有时,分数稳定性对研究者来说毫无意义,相反,我们希望分数是提高或者降低的(如教学、心理治疗、体育训练等),所以传统的信度理论(高信度)还要发展,以应对复杂的问题。第三节 效度(Validity)一、效度概述(一)效度要回答什么1、一个测验测量到什么东西?2、测验对它要测量的东西测验到什么程度?(二)效度的含义1、效度的概念:一个测验对其要测量的特性测量到什么程度的估计(操作定义) 2、效度的性质A.效度是针对测验的结果B.效度是针对特定的测验目的C.效度只有程度差异,不是全和无 三)效度的种类1、内容效度(content validity)测验用的测题对整个测验内容范围的代表性。如成就测验、掌握测验2、结构效度(construct validity)测验能说明心理学上的理论结构或特质的程度。如编制的量表 3、准则关联效度(criterion-related validity)预测效度、实证效度 测验分数与准则的相关程度。准则可以是不同性质的。 注意:高信度是高效度的必要条件,而非充分条件。效度系数小于或等于信度系数的平方根。 二、内容效度(一)含义:取样的适当性 条件:1、要有定义得完好得内容范围 2、测验的题目应是所界定的范围的代表性取样。(二)确定内容效度的方法 1、专家判断法 要件:定义好的总体、划分好细目表、确定好每个题目要测验的内容与技能、准确的评定量表 2、相关法 两个独立取样的测验复本去测同一组被试,如果相关高,一般可以认为具有高效度,但也有可能是同时偏向某个方向造成虚假效度。如果相关低,至少有一个是低内容效度的。3、再测法 测一次后,被试经过学习或训练,如果再测,其成绩提高较大,说明该测验是测这一个特质的,即内容效度高。4、经验法 如看测验分数是否岁年级而提高 (三)内容效度的特点1、内容效度具有一般性(根据公认的特质),但又具有特殊性(特定的测验)。2、内容效度与表面效度容易混淆。3、内容效度关心的不是测验本身,而是测验题目的代表性。4、内容效度没有可靠的数量指标。5、内容效度是许多测验要考虑的,但不适合人格和能力倾向测验,因为它们没有明确范围。影响效度的因素:1、测验本身的因素(题目、结构)2、实施3、信度
显示全部