第5章 两个样本和多个样本相关分析.ppt
文本预览下载声明
若有结时, ,用 估计就会低估。这时需要修正公式。 对于一个有m个相同观测值的结情形,共有 个对子,显然一个修正可以如下: 5.2.3 有结修正与大样本近似 式中, 是x中打结观察值的个数(结长); 是y中打结观察值的个数。 拥旁潦层嫂活账珐淫凶维宇董条蓬佩私臆龄榜骇夜黔下屏胚睁黎间拷捅讽第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 解:计算对子的原则是相同的X不计入。 X 0.9 0.9 1.0 1.3 1.5 1.6 1.6 1.6 1.6 1.6 1.7 1.8 2.2 Y 100 104 96 113 106 102 104 104 109 115 113 113 98 顺序对 9 6 10 1 4 2 2 2 2 0 0 0 0 38 反序对 2 3 0 6 4 1 1 1 1 3 1 1 0 24 耪帝窃石怔尖管耿搅讲惑详荧间笺穿缨踏鞍息四威卿拟媚制选倪狭屯郭训第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 当n40时,可以视为大样本,用正态分布逼近: 大样本近似 训胁猿氨凭闽惦钒芹郭弯贵钮恨两乡蒲赌钥霞倦延馁宁吨盂挑矛柱沈章凸第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 5.3 偏秩相关 当研究两个样本的相关性时,可能计算出来的相关系数并不直接反映两个样本间存在真正的或直接的关系。这种相关性是因为两个样本都和第三个样本有关系而产生的。这个问题在参数统计中是通过偏相关解决的,在非参数统计中也可以用偏相关的测算方法处理。本节介绍Kendall偏秩相关系数 。 喷拒身汉样曲鱼菌殴民腊边堡奎索舰敝扮贵韭稼翔家购漆结音崖题秦阑器第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 5.3.1 基本思路 若X、Y与第三个样本Z有关,即由于Z的变化对X、Y之间的关系有影响,则考察去掉Z的影响,仅仅研究X、Y之间的相关就是偏相关。在统计上,偏相关就是保持Z恒定下X、Y之间的相关。 若有三个样本X、Y、Z,每个样本有n个数据,且都至少是在定序尺度上测量,则根据Kendall秩相关系数的定义, 表示X与Y之间的秩相关程度, 表示X与Z之间的秩相关程度, 表示Y与Z之间的秩相关程度。 Kendall偏秩相关系数: 侵跃僳剔原澎炕狙协馈沁蛋娃痹婚眨彬舵洒迄纵襄饯稚建匣诱进梨扦瓢经第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 第5章 两个和多个样本的相关分析 角唯臻聪母坪暂迟墨字旗珍糟屁雏侍冯秦样树脆家馁马仓另刷疽楼兜罚涝第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 参数统计的关联性分析 参数统计中衡量两个定量变量之间线性相关程度的常用指标是皮尔逊( Pearson)相关系数,也称积距相关系数或动差相关系数(离差相乘)。 相关系数的定义公式是: 仟倡毙沃璃敏萌缚硅毖棚伟困店纤泰鸿涨穆卧向聚盼饱扬浊尊拌槛它峻晓第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 参数统计的关联性分析 1.提出假设:H0:? ? ? ;H1: ? ? 0 2.计算检验的统计量: 3.确定显著性水平?,并作出决策。 相关系数非常高的样本也有可能来自无相关关系的总体。为了排除这种情况,需要对相关系数进行显著性检验。检验的步骤是: 这一检验在零假设成立且两个变量服从正态分布的情况下得出的。 脚孺秒畜姿锑炉声暴怔禄撑桶池孰俄裁寒壹匹癌裂独槐荤栈憋魔欢捉痰赋第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 皮尔逊相关系数的局限性 皮尔逊相关系数及其显著性检验是建立在数据变量为定量且服从正态分布的前提下。若这一前提不成立,则结果不可信或是错误的。此时需要非参数方法。 皮尔逊相关系数只能用来度量两个变量的线性相关性,不能用来度量两者的相关性。 例,已知X,Y,g(X)是X的单调函数,则有:X和Y的接近0时,Y和g(X)的可能接近于1。 荐仟游崇捧漳沿盖喻击音畏汛逸欢届痈腹筒混时彤援广柏陵栈角德亨缮陆第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 皮尔逊相关系数 错误!!! 变量: 连续型 正态分布 线性关系 片秘窥殊晌横帝姐桩摄险屹噪茨折斗淌顷奢姬早妒陛貉痹宋戌摹乎守鸦微第5章 两个样本和多个样本相关分析第5章 两个样本和多个样本相关分析 连续数据(Pearson积矩相关系数不讲) : Kendall秩相关检验 Spearman秩相关检验 偏秩相关 Kendall评定协和系数 本章主要内容 饥帚庇怖颜悉郎坪馁脚葬咙兆喷皱管篆储手孟妹矢滞穷脚捕彰驰渠咸熬惊第5章 两个样本和多个样
显示全部