文档详情

数学实验之回归分析.ppt

发布:2025-04-06约3.97千字共26页下载文档
文本预览下载声明

第一讲:一元线性与非线性回归分析引例:钢材消费量与国民收入的关系一元回归模型与回归分析MATLAB软件实现简介一元非线性回归模型实验为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组历史数据。引例:钢材消费量与国民收入的关系年份196419651966……197819791980消费(吨)698872988……144627362825收入(亿)109712841502……294831553372试分析预测若1981年到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平?钢材消费量--------试验指标(因变量)Y;国民收入-----------自变量x;建立数据拟合函数y=E(Y|x)=f(x);作拟合曲线图形分析。问题分析:钢材消费量y与国民收入x的散点图y=a+bx回归分析是研究变量间相关关系的一种统计分析。特点:试验指标(因变量)是随机变量。图形解释:y=E(Y|x)=f(x)假设:f(x)=ax+bxx0E(Y|x0)y0........x1E(Y|x1)······假设:(y=E(Y|x)=f(x))1)Y是一个正态随机变量,即Y服从正态分布,并且有方差D(Y)=σ2。2)根据观测值作的散点图,观察出函数f(x)是线性形式还是非线性形式。回归模型及回归分析1、一元线性回归模型或需要解决的问题:1)在回归模型中如何估计参数a、b和σ2?知识介绍2)模型的假设是否正确?需要检验。3)利用回归方程对试验指标y进行预测或控制?参数估计设观测值为(xi,yi)(i=1,2,…,n),代入模型中,yi=a+bxi+εi解出的参数记为则回归方程:最小二乘法:回归模型的假设检验提出问题:1、相关系数检验|r|≤1|r|→1,线性相关|r|→0,非线性相关模型:Y=a+bx+εH0的拒绝域为:()-11||·0rα(n-2)-rα(n-2)2、F-检验法平方和分解公式:记为实测值估计值残差值,剩余平方和,越小越好认为线性回归效果好预测与控制给定的自变量x0,给出E(y0)的点估计量:y0的置信度为(1??)%的预测区间为:设y在某个区间(y1,y2)取值时,应如何控制x的取值范围,这样的问题称为控制问题。小结:或模型1、估计参数a,b,σ2;2、检验模型正确与否;(即b→0)3、预测或控制;已知数据(xi,yi)(i=1,2,…,n),如何利用MATLAB软件实现以上的统计计算?MATLAB软件实现使用命令regress实现一元线性回归模型的计算b=regress(Y,X)或[b,bint,r,rint,stats]=regress(Y,X,alpha)回归系数a,b以及它们的置信区间残差向量e=Y-Y及它们的置信区间相关系数R2,F-统计量和与χ0对应的概率p。残差及其置信区间可以用rcoplot(r,rint)画图。默认值是0.05引例求解输入:(hg1.m)x=[10971284150213941303155519172051211122862311200324352625294831553372];y=[698872988807738102513161539156117651762196019022013244627362825];X=[ones(size(x)),x],pause[c,cint,r,rint,stats]=regress(y,X,0.05),pausercoplot(r,rint)输出:c=-460.5282(参数a)0.9840(参数b)cint=-691.8478-229.2085(a的置信区间)0.87791.0900(b的置信区间)r=[79.124869.1244-29.3788-104.1112-83.5709-44.5286-109.7219-18.

显示全部
相似文档