第7章 相关分析与回归分析.ppt
文本预览下载声明
第七章相关分析与回归分析 本章内容 第一节 相关分析 第二节 线性回归分析 第三节 曲线估计 第一节 相关分析 一、相关分析的概念与类型 (一)相关分析的基本概念 相关关系是指变量之间存在的不确定的依存关系,即当一个变量取一定值时,另一变量无法依确定的函数取唯一确定的值,然而它仍按某种规律在一定的范围内变化。 (二)相关关系的类型 1、按相关关系的程度,分为完全相关、不完全相关和零相关。 2、按相关变量的变化方向,分为正相关和负相关。 3、按相关关系的表现形式,分为线性相关和曲线相关。 4、按变量多少,分为单相关、复相关和偏相关。 5、按相关性质,分为“真实相关”和“虚假相关” 绘制散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果。 二、散点图 (一)散点图的特点 绘制散点图是相关分析过程中极为常用且非常直观的分析方法,它将数据以点的形式画在直角平面上。通过观察散点图可以比较直观地看出变量之间的相关关系以及它们的强弱程度和数据的可能走向。通常橄榄球和棒状代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描述出来,使数据的主要特征更突显。 (二)散点图在SPSS中的实现 1、建立或打开数据文件后,进入“Graphs” →“Legacy Dialogs”→“Scatter/Dot”主对话框,如图7-1所示。 图7-1 散点图主对话框 2、选择散点图的类型。SPSS中提供了四种散点图,分别是简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D)。 3、根据所选择的散点图的类型,按Define按钮对散点图作具体定义。不同类型的散点图其具体的定义选项略有差别。 三、相关系数 (一)相关系数的概念和分析步骤 相关系数能够以数字的方式准确描述变量间的线性关系程度和方向。 相关系数的分析步骤: 1、计算样本相关系数 对不同类型的变量应采用不同的相关系数指标,但它们的取值范围和含义都是相同的,即相关系数 没有单位,其值在-1~+1 之间。 2、对样本来自的两总体是否存在显著的线性关系进行推断。 (1)提出原假设:总体中两个变量间的相关系数为0,即两总体无显著的线性相关关系。 (2)选择检验统计量。对不同类型的变量应采用不同的相关系数,对应也应采用不同的检验统计量。 (3)计算检验统计量的观测值和相伴概率 值。 (4)给定显著性水平 ,并作出决策。如果相伴概率值小于或等于给定的显著性水平,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。 (二)相关系数的种类 1、Pearson 简单相关系数 Pearson 简单相关系数用来度量定距型变量间的线性相关关系,它的数学定义为: (7.1) Pearson 简单相关系数的检验统计量为统计量,其数学定义为: (7.2) SPSS将自动计算Pearson 简单相关系数、检验统计量的观察值和对应的概率值。 2、Spearman等级相关系数 Spearman等级相关系数用来度量定序变量间的线性相关关系,设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据 ,而是利用数据的秩,用两变量的秩 代替 代入Pearson简单相关系数计算公式中,于是其中的 和 的取值范围被限制在1和 之间,且可被简化为: 式中: 如果两变量的正相关性较强,它们秩的变化具有同步性,于是 的值较小,r趋向于1; 如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是 的值较大,r趋向于0; 在小样本下,在零假设成立时, Spearman等级相关系数服从Spearman分布;在大样本下, Spearman等级相
显示全部