高三数学 线性回归分析.ppt
文本预览下载声明
课时小结: * 1.6 线性回归 问题1:正方形的面积y与正方形的边长x之间 的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是 否有一个确定性的关系? 例如:在7块并排、形状大小相同的试验田 上进行施肥量对水稻产量影响的试验, 得到如下所示的一组数据: 施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 一、线性回归分析 当施肥量x一定时,水稻产量y的值带有一定的随机性 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。 1、定义: 1):相关关系是一种不确定性关系; 注 对具有相关关系的两个变量进行统计分析的方法叫回归分析。 2): 相同点 不同点 函数关系 相关关系 均是指两个变量的关系 非确定关系 非随机变量与随机变量的关系 确定的关系 两个非随机变量的关系 二、现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等 三、回归分析 实质:通俗地讲,回归分析是寻找 相关关系中非确定性关系的某种确定性。 定义:对具有相关关系的两个变量进行统计分析的方法。 455 450 445 405 365 345 330 水稻 产量y 45 40 35 30 25 20 15 施化 肥量x 例1:在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg) : 2.散点图: (1)定义:表示具有相关关系的两个变量的 一组数据的图形。 (2)作用:形象反映各对数据的密切程度。 X Y O 3、观察散点图的特征 发现各点大致分布在一条直线的附近。 X Y O 哪一条最能代表变量X与Y之间的关系呢? 这样的直线可以画多少条呢? 其中 是待确定的参数,于是,当变量x 取一组数值 时,相应地 4、一般地,设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,我们来求在整体上与这n个点最接近的一条直线。 (1)设所求的直线的方程是: (2)各个偏差: 的符号有正有负,相加会相互抵消。 的和不能代表n个点与相应直线在整体上的接近程度。 用Q来表示n个点与相应直线在整体上的接近程度。 即: (3)各偏差的平方和: (4)求出使Q为最小值时的a、b的值: 其中 将所得到的方程 叫做回归直线方程,相应的直线叫做回归直线。 对两个变量所进行的上述统计分析叫做线性回归分析。 20475 18000 15575 12150 9125 6900 4950 xi yi 399.3 455 450 445 405 365 345 330 yi 30 45 40 35 30 25 20 15 xi 平均值 7 6 5 4 3 2 1 i 解:由题意,列出如下所示表格。 因此所求回归直线方程是: 由上表所可知: (5)回归直线方程的用途: 可以利用它求出相应于x的估计值。 例如:当x=28kg时,y的估计值是多少呢? 五、如下图是一组观测值的散点图: O X Y ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 按照上述方法,同样可以就这组数据求得一个回归直线方程,这显然毫无意义。 任给出一组数据能否由此求出它的线形回归方程? 想一想? 所求得的回归直线方程,在什么情况 下才能对相应的一组数据观测值具有代表 意义呢? 6、相关检验: (1)样本相关系数(相关系数) (2)相关系数的范围: |r|≤ 1 (3)相关系数的作用:衡量两变量之间的线形相关程度。 若|r|越接近于1,相关程度越大; 若|r|越接近于0,相关程度越小。 例2、利用r的计算公式来计算例1中水稻产量与施化肥的相关系数。 解:由 得到相关系数 7.显著性检验的一般步骤: ①、在附表3中查出与显著性水平0.05与自由度n-2(n为观测值组数)相应的相关系数临界值 .(显著性水平0.05是一个作为发生小概率事件的临界值,0.9,0.99以及上一节中用
显示全部