文档详情

心理与教育统计学05.ppt

发布:2017-03-03约4.37千字共44页下载文档
文本预览下载声明
我们被信息淹没, 但却缺乏知识。 Rutherford D. Roger §5.1 相关的意义 相关关系 (类型) 相关系数 (correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,记为 r 1、正相关 2、负相关 3、零相关 相关系数 (取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数 (取值及其意义) 散 点 图 散点图 (scatter diagram) 散点图 (例题分析) 【例5.1】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图 (例题分析) 散点图 (例题分析) 标准分数散点图 §5.2 积差相关 计算相关系数的一种最常用的方法 要求成对数据,且不少于30对 两列变量各自总体为正态 两列变量均为连续变量 只反映两列变量之间的线性关系 积差相关的使用条件 1、两个变量都是由测量获得的连续性数据。 2、两个变量的总体都呈正态分布。 3、必须是成对数据,而且每对数据之间相互独立。 4、两个变量之间呈线性关系。 5、排除共变因素的影响。 6、样本容量N大于或等于30。 积差相关系数 (相关统计量) 样本均值 积差相关系数 (计算公式) §5.3 等级相关(秩相关) 计算相关系数的一种最常用的方法 两列变量各自总体不一定为正态 两列变量均为定序变量或数值型变量 只反映两列变量之间的线性关系 以等级次序排列或以等级次序表示的变量之间的相关 包括斯皮尔曼等级相关和肯德尔W系数 斯皮尔曼等级相关 当两个变量以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30。 适用用于两列定序变量之间的线性相关程度的度量。 适用于非正态数值型数据的线性相关程度的度量。 等级相关系数计算公式 等级相关(例子) 等级相关(例子) 这10人的视听反应时的等级相关系数为0.71. 等级相关(例子) 等级相关(例子) 肯德尔W系数 当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量。 多列等级变量相关程度的一种度量方法 原始数据的获得采用等级评定法,即让K个评价者对N件事物进行等级评定,每个评价者都能对N件事物排出一个等级顺序。最小等级数为1,最大为N。 W值介于0、1之间。如果K个评价完全一致,则W=1;如果K个评价存在一定的关系,但不完全一致,则0W1;如果K个评价完全不一致,则W=0。 W的基本计算公式 有相同等级时W的计算 肯德尔和谐系数的计算例子 肯德尔和谐系数的计算例子 肯德尔和谐系数的计算例子 肯德尔和谐系数的计算例子 §5.4 质与量相关 需要计算相关的两列变量其一为数值型数据,另一为分类数据。这样两列变量的直线相关称之为质量相关。 包括点二列相关,二列相关,多列相关。 二列相关 当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关。 使用条件: 1、两个变量都是正态连续变量 2、两个变量之间是线性关系 3、二分变量是人为划分的 4、样本容量N应当大于80 相关系数的计算: 点二列相关 条件:两列变量中,其一为数值型数据,总体为正态分布,另一为真正二分变量。 计算公式: 取值范围: 点二列相关(例子) §5.5 品质相关 用于表示R×C(行×列)表的两个变量之间的关联程度。 一般都是计数数据 四分相关, Φ相关,列联表相关。 四分相关 适用数据:两个变量都是连续变量,且呈线性关系,每一个变量都被人为地分成两种类型。 数据的表示: 四格表 计算公式: Φ相关系数 表示两因素两项分类资料相关程度最常用地一种相关系数。 计算公式: 列联表(contingence table)相关
显示全部
相似文档