文档详情

SPSS回归分析案例解读.docx

发布:2017-03-28约1.25千字共9页下载文档
文本预览下载声明
偏度 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。 表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。 正偏离(右偏态)、负偏离(左偏态): 正态分布的偏度为为0,两侧尾部长度对称。若以bs表示偏度。bs0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。若知道分布有可能在偏度上偏离正态分布时,可用偏离来检验分布的正态性。右偏时一般算术平均数中位数众数,左偏时相反,即众数中位数平均数。 计算: 1. 2. 其中: 而,数学期望 所以: 举个栗子(见excel表中): Χ2分布,t分布,F分布 Χ2分布: t分布: F分布: 关于p分为点 决定系数(coefficient of determination) 有的教材上翻译为判定系数,也称为拟合优度,决定系数是指在x或y的总变异中,可以相互以直线关系说明的部分所占的比率。即在Y的总平方和中,由X引起的平方和所占的比例,记为R^2(R的平方)。 当R^2越接近1时,表示相关的方程式参考价值越高,越符合回归线。 计算: RSS = (回归平方和)TSS = (总离差平方和) 区别: SPSS-线性回归(举个栗子) 例1. 某分公司连续6年记录了员工的平均工资,数据如下表,试建立线性回归模型。 第1年 第2年 第3年 第4年 第5年 第6年 1672.5 1772.8 1932.1 2029.3 2129.8 2240.7 操作步骤 (1)定义变量:年份定义为x,工资定义为y,点击“变量试图”,定义x,y变量; (2)数据录入:点击“数据视图”,输入x,y对应的数据; (3)线性回归准备:“分析”-“回归”-“线性”,打开“线性回归”的对话框; (4)线性回归:选择因变量y进入“因变量”栏中,选择自变量x进入“自变量”栏中,单击右上角的“statics”统计对话框可以选择要计算的统计数据,最后单击左下角的“确定”按钮; (5)结果分析(α系数默认为0.05): 图1 图2 图3 图4 图2中R^2是0.995,表明Y的总平方和中,由X引起的平方和所占的比例为99.5%。图4中第二栏是非标准化的系数估计与标准误差,常数项的估计值为1561.947,x的系数估计值为114.549,回归方程的显著检验的t值为27.303,对应的p值约等于0.000,表明检验显著,因此该线性回归方程有效,可表示为:y = 114.549x + 1561.947。
显示全部
相似文档