相关分析与回归模型.ppt
一元回归分析是根据统计资料,寻求一个变量对另一个变量的恰当数学表达式—经验方程,来近似地表示变量间的平均变化关系的一种统计分析方法。本节系统介绍一元线性回归模型。01一元线性回归是描述两个变量之间相关关系的最简单的回归模型。掌握了一元线性回归模型的建模思路与方法,就容易掌握和理解其他较复杂的回归模型。02一元线性回归模型03一元线性回归模型为04第二节一元回归分析一般我们称y为被解释变量(因变量),称x为解释变量(自变量)。式中和是未知参数,称为回归系数。u是不可观测的随机变量,表示x和y关系中的不确定因素的影响,也称为随机误差。通常假定?对n组样本观测值则(6)其中,随机误差满足:且相互独立。回归分析的主要任务就是通过n组样本观测值,对和进行估计。设和分别为和的估计值,(7)则称为经验回归方程或样本回归方程;为的回归值或拟合值为经验回归方程的斜率,在实际应用中表示x每增加一个单位时,y平均变动的单位;为经验回归方程的截距。为残差。01回归参数的估计02最小二乘法求参数和的估计值和,为此应使残差平方和03取最小值。利用微积分中求极值的方法,得到正规方程组:04正规方程组正规方程组的解为.9根据例8.2给出的10个家庭月收入与月消费支出的统计资料(见表8.2),试建立家庭月消费支出对家庭月收入的线性回归方程。于相关分析和回归模型第一节相关分析第二节一元回归分析第三节?多元线性回归分析第四节?可线性化的曲线回归附录:用Excel计算相关系数和进行回归分析第一节相关分析变量相关的概念系是变量之间的一种完全确定的关系,即一个变量的数值完全由另一个(或一组)变量的数值所确定。例如,银行的1年期存款利率为2.25%,设存入本金为x,到期的本息为y,则观事物都是相互联系的,而且任一事物的变化都与其周围的其他事物相互联系和相互影响。客观现象之间的相互联系,可以通过一定的数量关系反映出来。现象之间的关系形态有两种类型:函数关系和统计相关关系。这里x与y表现为一种线性函数关系。微积分学是研究函数关系的数学学科。图1?线性函数???????????????????的图形统计相关关系是变量之间存在的不完全确定性的关系。在实际问题中,许多变量之间的关系并不是完全确定性的,例如居民家庭消费与居民家庭收入这两个变量的关系就不是完全确定的。收入水平相同的家庭,它们的消费额往往不同;消费额相同的家庭,它们的收入也可能不同。对现象之间相关关系密切程度的研究,称为相关分析。图2?居民家庭收入与消费支出的数据作出的散点图1相关关系的种类2关所涉及变量的多少,相关关系分为单相关与复相关。两个变量之间的相关关系称为单相关;多个变量之间的相关关系称为复相关。3关的形式不同,相关关系分为线性相关与非线性相关。如果变量之间的关系近似地表现为一条直线,则称为线性相关;如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关。4的散点大致分布在一条直线两侧,表明两个变量之间是线性相关;图3中散点的分布大致呈抛物线形状,表明两个变量之间是非线性相关。图3?非线性相关量相关方向的不同,相关关系分为正相关与负相关。正相关是指两个变量之间的变化方向一致,都是增长或下降趋势,如居民收入增加,居民消费额随之增加,故它们是正相关;负相关是指两个变量变化趋势方向相反,如产品单位成本降低,利润随之增加,故它们是负相关。01例如,在例2中给出了10个家庭的月收入和月消费支出的统计数据,它们之间呈正相关趋势;在例3中给出了某企业上半年产品产量和单位成本的统计数据,它们之间呈负相关趋势。02关程度的不同,相关关系分为不相关、完全相关和不完全相关。如果两个变量彼此的数量变化相互独立,这种关系称为不相关;如果一个变量的数量变化完全由另一个变量的数量变化所唯一