第七章相关与回归分析.ppt
文本预览下载声明
第7章 相关与回归分析 7.1 相关分析 7.2 一元线性回归分析 一、变量间的关系 函数关系与统计关系 (一)函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 函数关系(几个例子) (二)统计关系 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 统计关系(几个例子) 二、统计关系的类型 (一)按相关的程度不同分 完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,称两种现象间的关系为完全相关。 如:价格不变,销售额与销售量成正比例关系 不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。 如:股票价格与气温不相关。 不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。 (二)按相关的形式不同分 线性相关:当两种相关现象之间的关系近似地表现为一条直线,称之为线性相关。 如:人均消费水平与人均收入水平 非线性相关:如果两种现象之间的关系,近似地表现为一条曲线,称为非线性相关。 如:农作物产量与施肥量 (三)按相关的方向不同分 正相关:当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。 例如: 居民收入与储蓄额 负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。 例如:物价与消费的关系 (四)按变量的多少分 单相关:两个变量间的相关,称为单相关。 复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。 例如:农作物产量与气温、降雨量、施肥量之间的相关关系。 三、相关分析内容 相关分析的内容 相关分析:就是对两个或两个以上变量之间相关程度的描述与度量。 相关分析要解决的问题 变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体变量之间的关系? (一)相关关系的描述:散点图 散点图(scatter diagram) 散点图(例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2005年的有关业务数据 散点图(例题分析) 不良贷款对其他变量的散点图 (二)相关关系的测度:相关系数 相关系数(correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r 也称为线性相关系数(linear correlation coefficient) 或称为Pearson相关系数 (Pearson’s correlation coefficient) 总体相关系数 (计算公式) ? 1890年,英国统计学家皮尔逊提出的积矩相关系数公式: 样本相关系数 (计算公式) ? 样本相关系数公式: 样本相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数的性质 1. r 的取值范围是 [-1,1] 2. |r| = 1,为完全线性相关 r = 1,为完全正线性相关 r = -1,为完全负线性正相关 3. r = 0,不存在线性相关关系 4. -1 ? r 0,为负线性相关 5. 0 r ? 1,为正线性相关 6. |r| 越趋于1表示线性相关程度越高; |r| 越趋于0表示线性相关程度越低。 相关系数(取值及其意义) 相关系数(例题分析) 用Excel计算相关系数 一、回归分析 (一)回归分析及其内容 回归分析(Regression) :从一组样本数据出发,确定变量之间的数学关系式 回归分析要解决的问题 对关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据
显示全部