82一元线性回归模型及其应用第2课时教学设计-高二下学期数学人教A版选择性.docx
8.2《一元线性回归模型及其应用》教学设计第2课时
一、教学目标
(一)新课标要求
理解一元线性回归模型的概念,掌握参数估计的最小二乘法。
会利用一元线性回归模型进行预测,了解模型的适用范围和局限性。
能够通过残差分析判断模型的拟合效果,理解决定系数的意义。
(二)核心素养
数学抽象:从实际问题中抽象出一元线性回归模型,理解模型中参数的意义。
数学运算:运用最小二乘法计算回归方程的参数,计算残差和决定系数。
数据分析:通过对数据的分析,建立合适的回归模型,并对模型的拟合效果进行评价。
逻辑推理:根据残差分析和决定系数判断模型的合理性,对模型进行改进。
二、教学重难点
(一)教学重点
一元线性回归模型的建立和参数估计。
利用回归方程进行预测和残差分析。
(二)教学难点
理解最小二乘法的原理。
通过残差分析和决定系数评价模型的拟合效果。
三、教学方法
讲授法、案例分析法、小组讨论法
四、教学过程
(一)导入(5分钟)
展示教材中关于树高与胸径关系的数据表,并引导学生观察散点图.
提问:从图中可以看出树高和胸径之间存在怎样的关系?
能否用一个数学模型来描述这种关系?
从而引出本节课的主题——一元线性回归模型.
(二)新课讲授(20分钟)
一元线性回归模型的概念
首先,在黑板上或通过多媒体展示一元线性回归模型的一般形式:然后,详细解释各个符号的含义:
是响应变量,也就是我们想要研究和预测的变量,比如在树高与胸径的例子中,树高就是响应变量;是解释变量,它是用来解释响应变量变化的因素,这里胸径就是解释变量.
和是模型的参数,表示回归直线的斜率,反映了每变动一个单位时,的平均变动量;表示回归直线在轴上的截距.
是随机误差项,它包含了除之外其他所有影响的因素,这些因素是我们无法控制或未考虑到的,并且满足(即随机误差的均值为0,意味着从平均意义上,这些随机因素的影响相互抵消)和(表示随机误差的方差为,衡量了随机误差的离散程度).
通过上面教材中树高与胸径关系的图表(图8.23、图8.29),结合图表强调在实际问题中,我们通过观察散点图(如图8.29中散点大致分布在一条直线附近),判断两个变量可能存在线性关系,从而考虑使用一元线性回归模型来描述它们之间的关系。明确指出在这个例子里,胸径是解释变量,树高是响应变量.
在平面直角坐标系中,每个样本点,这里是样本数量,对于表8.23中数据(=12)都对应一个实际观测到的胸径和树高的组合.
根据表8.23中的数据,实际计算树高与胸径的经验回归方程
利用回归方程进行预测和残差分析
计算树高的预测值:例如,当胸径=18.1时,19.4,将计算结果填入类似表8.24的表格中.
引入残差的概念:对比树高的实际观测值和预测值,定义残差.
在树高的例子中,当胸径=18.1时,实际树高=18.8,预测树高19.4,则残差=18.819.4=0.6,依次计算出表8.24中所有的残差.
以胸径为横坐标,残差为纵坐标,残差图(图8.211)如下:引导学生观察残差图的特点:
观察残差是否均匀地分布在横轴两侧。如果是,说明模型能够较好地拟合数据,因为这意味着随机误差是随机分布的,模型能够捕捉到数据中的主要线性关系;如果残差呈现明显的规律,比如大部分残差在某一段集中在横轴上方或下方,或者呈现周期性变化等,这就说明模型可能存在问题,可能变量之间不是简单的线性关系,或者还有其他重要因素没有被纳入模型.
观察残差的绝对值大小。残差的绝对值越小,说明预测值越接近实际值,模型的预测效果越好;如果残差的绝对值较大,说明模型的预测存在较大误差,需要对模型进行改进.
决定系数
给出决定系数公式,并详细解释其意义:
首先解释分子是残差平方和,它衡量了模型预测值与实际值之间的差异程度,这个值越小,说明模型的拟合效果越好.分母是总离差平方和,它反映了响应变量自身的离散程度.
越接近1,说明残差平方和相对于总离差平方和越小,即模型能够解释的的变化部分越多,模型的拟合效果就越好;越接近0,说明模型能够解释的的变化部分越少,模型的拟合效果越差.当=1时,说明所有样本点都在回归直线上,模型完全拟合数据;当=0时,说明回归直线完全不能解释的变化,相当于用均值来预测.
结合男子短跑100m世界纪录的案例(表8.25至表8.27),对比两个经验回归方程的值:
展示一元线性回归方程和非线性回归方程.
根据表8.27中计算出的残差,
分别计算两个方程的值(详细展示计算过程).通过对比发现,非线性回归方程的值更接近1,说明非线性回归模型对于原始数据的拟合效果远远好于一元线性回归模型。同时,结合图8.216和图