环境统计学-第三章一元线性回归.ppt
1环境统计学授课教师:林红军授课时间:2010学年第二学期Presentation〔EnvironmentalStatistics〕环境科学系办公地点:校8幢123室,17幢612室E-mail:,linhonjun@163Cell:15958459856,679856
2环境统计学第1章绪论第2章概率统计根底第3章环境一元线性回归分析第4章环境多元线性回归分析第5章环境系统聚类分析第6章环境模糊聚类分析第7章环境判别分析第8章环境主成分分析第9章环境因子分析第10章人工神经网络第11章环境空间统计分析
3随机事件随机试验随机事件事件的运算概率概率古典概率概率计算数学特征数学期望方差变异系数协方差相关系数概率数学特征随机事件概率分布正态分布t分布x2分布F分布概率分布统计推断参数估值点估计区间估计置信区间假设检验统计推断概率统计基础
4变量间的关系函数关系或确定性关系:研究的是确定现象非随机变量间的关系。统计关系:研究的是非确定现象随机变量间的关系。变量之间的关系,大体可分为两类:银行的1年期存款利率为年息2.25%,存入的本金设为x,到期本息为y,则存在关系:(不考虑利息税)水污染程度y与城市人口规模x之间的关系收入水平y与受教育程度x之间的关系环境一元线性回归分析
5对变量间统计关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的:
6几点注意不线性相关并不意味着不相关;有相关关系并不意味着一定有因果关系;相关分析研究一个变量对另一个〔些〕变量的统计依赖关系,但它们并不意味着一定有因果关系;相关分析对称地对待任何〔两个〕变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量〔被解释变量〕和自变量〔解释变量〕:前者是随机变量,后者不是。
7回归分析是研究一个变量关于另一个〔些〕变量的具体依赖关系的计算方法和理论。这里前一个变量被称为被解释变量〔ExplainedVariable〕或应变量〔DependentVariable〕,后一个〔些〕变量被称为解释变量〔ExplanatoryVariable〕或自变量〔IndependentVariable〕。回归分析的根本概念水污染程度y与城市人口规模x之间的关系收入水平y与受教育程度x之间的关系
8“回归”一词的历史渊源“回归”一词最早由FrancisGalton引入。Galton发现,虽然父母的身高对子女的身高起到决定性作用,但给定父母的身高后,他们儿女辈的平均身高却趋向于或者“回归”到社会平均水平。Galton的普遍回归定律〔lawofuniversalregression)。Galton的朋友KarlPearson通过收集一些家庭的1000多名成员的父子身高数据,证明儿子确实“回归到中等〔regressiontomediocrity)”
9回归模型的类型
10由于y与x之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内.于是模型的一般形式为yi=f(xi)+ε其中y是随机变量,x是普通变量,ε是随机项.线性回归模型yi=f(xi)x,y之间函数关系表示为
11假设进行n次独立试验,得到变量y与x的一组观测值(xi,yi)(i=1,2,…,n),则有yi=f(xi)+εi(i=1,2,…,n)将点(xi,yi)画在平面直角坐标系中得到的图称为散点图(见图).图14-10
12如果所有的散点大体上散布在某一条直线附近(见图),就可以认为Y对x的回归函数的类型为直线型,即,称此方程为Y对x的回归直线方程,并称其中b的为回归系数,在y的上方加“^”,是为了区别于Y的实际观测值y.如果随机变量Y与非随机变量x之间存在着线性相关关系,则可用回归直线方程来描述.图14-11
13散点图
(scatterdiagram)????????????不相关?????????负线性相关?????????正线性相关????????????非线性相关???????完全负线性相关完全正线性相关?????????
14一元线性回归分析的前提条件1〕直线相关关系2〕两个变量之间存在显著相关3〕足够多的资料,并且自变量因变量明确4〕?值相互独立,且同方差,?~N〔0,σ2〕
15一元线性回归参数求解最小二乘法
16最小二乘法