文档详情

心理测量学14效度(一)解析.ppt

发布:2017-01-06约4.13千字共28页下载文档
文本预览下载声明
第十四讲 效度(一) 主讲教师: 魏然 本讲的主要内容 效度的概述 内容效度 结构效度 准则关联效度 一、效度的概述 (一)效度的定义 操作性定义——效度(validity)就是测验测到它打算测的东西的程度,或者说,是根据测验分数所作出的推论的恰当性程度。 理论定义——因为总方差(即实得分数的方差St2 )可以分为测量特性引起的方差(Sco2)、系统误差引起的方差(Ssp2)、误差方差(Se2)三个部分,因此效度是总方差中由所测量的特性造成的变差所占的百分比 如何理解效度的这个定义? 测量工具的正确性,或者说测验的效度,总是针对着要解决的问题来说的,亦即针对打算作出的应用来建立的,因此不能把效度绝对化。 要确定测验在解决某方面问题时的效度,不能凭主观意愿,而要靠收集的客观事实材料和证据来证明。这种收集大量资料和证据来检验测验效度的工作,叫做效度验证(validation) 效度是测验客观上的正确性程度,应该由实际资料本身来证明。但是,测验编制者与开发者的效度研究报告,即使是科学的、恰当的,也只能为测验使用者提供某些事实与概念,测验能否有效被使用,取决于使用者本人。 (二)效度的种类 关于效度种类划分的历史背景 直到20世纪50年代初,关于效度的理论都是相当混乱的。很长时间内,人们把效度理论等同于预测理论。 美国心理学协会1954年给出效度的第一个形式化定义,从而使效度理论逐步和预测理论相分离。 由于各方的争议,在效度的第一个形式化定义的基础上,美国心理学协会在20世纪70年代又对效度及其种类重申并补充。 “效度就是由测验分数或其他评估形式所作出的推论的恰当性”(Validity refers to the appropriateness of inferences from test scores or the forms of assessment)。根据这一标准可以把效度区分为三种类型: 内容效度(content validity)——是用表明测验内容多么好(代表性)来进行评估的。而测验所包含的,是应予抽取的情境类别和题材资料。 结构效度(construct validity)——是用考查测验测量的是什么心理特性来评估的,亦即要确定某种概念或结构说明测验成绩的程度。 效标关联(预测)效度(criterion-related [predictive] validation)——把测验分数或由它们所作出的预测,跟外部变量【效标】(external variable [criterion])作比较;而这种外部变量【效标】,被认为提供了问题中的行为或特点的直接测量。 一般认为,在讨论效度问题时,把对测验的解释或推论区分成如下两类是有帮助的: 这种解释或推论,是对测量之外的其他成绩的推测,这种预测的正确程度,取决于效标关联效度的证据。 这是对被测的人的性质,即他的行为属于何种行为领域(behavioral domain)的推论。要考察测验项目实际上代表行为领域的程度,这种代表性又可进一步区分为样本(sample)和标志(sign)。 (三)效度与信度的关系 高信度是高效度的必要条件,而非充分条件 也即是说,效度高,信度一定高;信度高,效度不一定高。 信度系数的平方根是效度系数的最高限度 测验的准则关联效度与测验本身的信度和准则测量的信度有关,若这两个信度较低,则效度系数会降低,从而低估测验的真实效度,因而要用减弱矫正法进行校正。即下式: 二、内容效度 (一)含义——内容效度的研究目的是要评估测题是否充分代表了所要测量的内容范围,即测验题目对有关内容或行为范围取样的适当性,它所关注的是测验的内容方面。例如,家长带孩子去作智力测验,他们关心的是这个测验是不是真的能够测查智力。 (二)验证和提高内容效度的方法 专家评定 评分者信度 克朗巴赫的量化方法(即计算同一组被试在两个独立取自同样内容范围的测验上的得分相关) 在编制测验以前,严格编写双向细目表 在编制测验时,考虑国家、种族、性别差异对内容效度的影响。 它是一个二维的表格,其行和列分别表示所要测量的学习结果以及教材的内容,而行与列交叉的数据表明对某一内容达到某种结果所占的权重。编制时,要先列出教材的重点内容和所要达到的学习结果,再根据各个部分的相对重要性决定它们的权重。 (三)内容效度与表面效度的区别 表面效度是指测验使用者或被试的主观认识上觉得有效的程度。严格的说,表面效度不算效度。 表面效度由于会影响到被试的合作态度,进而可能影响到测验的内容效度,因此在不同的测验类型中,还是应该予以重视,并加以调整。 三、结构效度 (一)含义 结构(construct)是指用来解释人类行为的理论
显示全部
相似文档