统计学原理_第七章_相关与回归分析.ppt
文本预览下载声明
简单直线回归估计标准误差计算 简捷公式: 相关系数和估计标准误差的关系 或 相关系数与估计标准误差表现为相反的关系。 1、 越大, 越小。极端时, , 此时,实际值与理论值完全相等,完全相关。 2、 越小, 越大。极端时, , 图上表现为回归线与 数列的平均线重合,不相关。 例 计算上例回归直线的估计标准误差 产量 (公斤) 生产费用(万元) 200 4 220 4.5 250 4.7 270 4.8 280 5.2 合 计1220 23.2 — 16 20.25 22.09 23.04 27.04 4.0944 4.3424 4.7144 4.9624 5.0864 108.42 5717 800 990 1175 1296 1456 0.008911 0.024838 0.000207 0.026373 0.012905 0.073234 根据回归方程 计算出每个产量对应的生产费用的理论值 另一种公式: 曲线回归(非线性) 一般先将曲线用代换法线性化,在按照最小平方法进行处理。 模型: 同样采用最小平方发求解。 多元线性回归(介绍) 第七章 相关与回归分析 刘荣坤 山东师范大学商学院 E-mail:lrk8284@126.com Tel问题: 1、某研究人员调查了济南在校大学生的每周平均自习时间,并收集了相应的期末考试成绩,他想知道研究自习时间与学习成绩是否有关系,如何判断这种关系的表现形式,关系的密切程度以及它们之间如何作用? 2、某企业想做广告来宣传某产品,如何了解和判断广告费用与销售之间的关系,以选择一个适当的广告投入? 相关与回归分析概述 简单线性相关分析 线性回归分析 非线性回归分析 第一节 概 述 概念 现象之间的关系表现为: 函数关系:一种确定性、严格的依存关系,可以用数学表达式准确表示出来。 相关关系:现象之间存在一定的数量依存关系,但不是固定的。 现象之间客观存在数量上的依存关系。 这种依存关系不是确定的 从某种角度说,函数关系是相关关系的特例。 父亲身高x与子女身高y之间的关系 受教育程度x与收入水平y之间的关系 居民收入x与商品的消费量y之间的关系 广告费支出x与商品销售额y之间的关系 在具有相互依存关系的两个变量中, 作为根据的变量称自变量,一般用X表示; 发生对应变化的变量称因变量,一般用y表示。 例 相关关系种类 因素多少 单相关:两个因素 复相关:三个以上因素 相关形态 直线相关(线性相关):表现近似直线 曲线相关:表现近似曲线。 正相关:同向变化 负相关:反向变化 相关程度 完全相关:实质就是确定性的函数关系 不完全相关:这个是要研究的相关分析。 无相关:因素之间完全没有关系。 平均意义上的 相关分析的主要内容 1、确定现象之间的相关性以及其相关关系的表现形式; 2、确定相关关系的密切程度; 3、选择适当的数学模型; 4、测定估计值的可靠程度。 5、检验相关关系的显著性。 相关分析是为了消除偶然因素影响,以找出现象之间的依存关系和程度以及变动规律。主要内容如下: 相关分析:研究变量之间关系的密切程度 回归分析:研究变量变动之间的因果关系 第二节 简单线性相关分析 散点图(scatter plot) 两种相关分析方法:定性分析(图表法)和定量分析(相关系数)。定性分析一般只适用于两个变量。 · · · · · · · · · · · · · 支出 收入 散 点 图 相关系数的计算和应用 相关系数定量说明现象之间的密切程度。 积差法 相关系数:用无量纲的系数形式表示变量之间的相关程度。 协方差:用来表示变量关联程度的绝对指标。显然受标志大小的影响。 简捷计算方法(三个简捷公式) 已知平均值时,可采用: 已知平均值和标准差时,可采用: 相关系数的特点和相关程度的判断标准 特点 判断标准:一般地 产量 (公斤) 生产费用(万元) 200 4 220 4.5 250 4.7 270 4.8 280 5.2 合 计1220 23.2 例 某企业生产调查,资料如下: 计算产量和生产费用的相关系数。 1936 576 36 676 1296 0.4096 0.0196 0.0036 0.0256 0.3136 0.772 4520 28.16 3.36 0.36 4.16 20.16 56.2 积差法: 简捷法: 产量 (公斤) 生产费用(万元) 200 4
显示全部