第十一章管理统计学.pptx
文本预览下载声明
;;变量之间的关系:确定型的函数关系和不确定性的函数关系
回归分析——研究随机变量之间的相关关系的一种统计方法。
;相关关系的特点 ;不相关;相关系数——对变量之间关系密切程度的度量
的取值范围是 [-1,1]:
完全相关 /完全正相关 /完全负相关 /不存在线性相关关系 /负相关 /正相关 ;对相关系数的显著性检验;例11.1 设有10个厂家的投入和产出如下,根据这些数据,我们可以认为投入和产出之间存在相关性吗?
;决定系数——说明自变量解释因变量变化百分比的度量 。
回归分析——一组样本数据出发,确定变量之间的数学关系式,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。然后利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。;相关分析与回归分析的区别;一元线性回归的基本概念;最小二乘回归法(least squares regression)就是寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合一条直线。;包含残差的散点图 ;残差一般沿着轴显示;回归方程的显著性检验(总体显著性检验);;回归系数的显著性检验;检验步骤如下:
提出假设
(没有线性关系)
(有线性关系)
计算检验的t统计量
,自由度为n-2;
确定显著性水平?,并进行决策
若 拒绝H0 ;
若 接受H0 。;预测标准误差;回归方程在估计和预测中的应用;
区间估计
对于自变量的一个给定值x0,根据回归方程得到因变量的一个估计区间。
置信区间估计
利用估计的回归方程,对于自变量 x 的一个给定值x0,求出因变量y的平均值 的估计区间,这一估计区间称为置信区间。
用公式表示在1-a 置信水平下的置信区间:
;相关系数,决定系数和预测标准误差的三者关系 ;决定系数r2可以直接从ANOVA中得出。它表示回归平方和占总离差平方和的比例。
当SSE或标准误差减小时,r2增加。
预测标准误差也可以从ANOVA中得出: ;多元线性回归 ;二元线性回归方程为:
其中, 分别是 的偏回归系数。
同理三元线性回归方程为 :
由样本数据推算、估计回归方程中各个回归系数,是多元回归分析中的一个重要方面,下面简要介绍回归系数的计算方法。;二元线性回归方程中回归系数 可由以下方程组解出:
用手解这些方程枯燥而费时,一般来说,自变量超过3个时,要用矩阵运算,可以借助计算机软件解出参数。;对多元回归模型的评估 ;模型的整体检验
对多元回归方程的整体性检验,就是要看自变量
是否整体上对随机变量y有影响。
检验方法是将回归离差平方和(SSR)同残差平方和(SSE)加以比较,应用 F 检验来分析二者之间的差别是否显著。如果是显著的,因变量与自变量之间存在线性关系;如果不显著,则因变量与自变量之间不存在线性关系。 ;多元回归模型的整体性检验的步骤如下:
提出假设
H0:
H1: 至少有一个回归系数不等于0 。
计算检验统计量 F
回归平方和 ;残差平方和
确定显著性水平和分子自由度m,分母自由度n-m-1,找出临界值Fa ;
???出决策:若F? Fa ,拒绝H0;若F Fa ,接受H0 。;多重样本决定系数 ;多重预测标准差 ;回归系数的显著性检验;可线性化的非线性回归;指数函数;幂函数;双曲函数;对数函数; 令 , ,则
;
显示全部