14练习题解答第十四章多元回归分析.doc
文本预览下载声明
第十四章 多元回归分析
练习题:
1.为了研究某社区1500名居民的受教育年数(X)与收入(Y)的关系,随机抽取了20人进行调查,得到下表的结果。
个案编号 1 2 3 4 5 6 7 8 9 10 受教育年数(X) 10 9 12 15 14 9 16 5 6 13 收入(Y) 1000 1000 1300 2000 1900 900 2100 600 800 1400 个案编号 11 12 13 14 15 16 17 18 19 20 受教育年数(X) 19 12 18 7 5 10 20 11 8 12 收入(Y) 3200 1500 3000 800 500 1100 3500 1300 950 1100 根据统计结果,
(1)画出散点图;
(2)X与Y之间是否呈直线关系?求出回归方程。
(3)计算X与Y的决定系数。
(4)在0.05的显著性水平下,作回归系数的显著性检验。
解:
(1)散点图:
(2)从散点图可以看出,受教育年数与收入呈现出线性相关的关系;
根据上表数据计算可得:
,,,,,, ,,
根据一元线性回归方程回归直线的斜率b和截距a的计算公式可知:
所以,回归方程是=-646.66+185.64X
(3)
决定系数
(4)回归系数的检验:
研究假设:(即)
虚无假设:(即)
用F检验法:
df1=k=1
df2=n-k-1=20-1-1=18
其中,k表示自变量的个数,将 代入上式可得:
在0.05的显著性水平下,从F分布表可知df1=1,df2=18时。否定域是:F≥4.41。因为F=182在否定域内,所以可否定虚无假设,接受研究假设。研究结论是:在0.05的显著性水平下,该社区居民的受教育年数(X)与收入(Y)呈线性相关的,且教育年数每增加一年,收入增加185.64元。
2.子女的受教育水平(Y)往往受到父母的受教育水平(X1,X2)以及家庭经济条件(X3)的影响,我们对某单位10个人进行了调查,得到如下表格:
被调查者受教育年数(Y) 父亲受教育年数
(X1) 母亲受教育年数
(X2) 家庭经济条件
(X3) 1 15 9 8 中 2 12 8 9 中 3 15 12 11 上 4 19 15 12 上 5 9 7 5 中 6 10 8 8 下 7 9 6 7 中 8 14 9 9 下 9 16 10 12 中 10 18 14 12 上 根据数据统计:
(1)求出各X变量的回归系数,写出回归方程。
(2)计算X与Y的决定系数。
解:
(1)变量X3为定序变量,对其重新赋值:“上”=3,“中”=2,“下”=1。
计算各个变量之间的积距相关系数为:
=0.920,=0.886,=0.600,=1,==0.848,==0.719,==0.545
将之代入下列方程组:
计算可得:
=0.672, =0.360, =-0.079
根据上表计算可得:
=13.70,=3.59;=9.80,=2.97;
=9.30,=2.41;=2.10,=0.74。
将之代入公式:
可得: =1.54,=0.81, =0.54, =-0.38
(2)决定系数:
3.根据武汉市初中生日常行为状况调查的数据(data9),用SPSS分析初中生平时每天做作业时间(),看电视时间(),睡觉时间()对其目前学习成绩的影响(目前成绩在班级中的大致水平),并对结果进行解释。
解:《武汉市初中生日常行为状况调查问卷》:
C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)
平时(非节假日):
1)做作业_______小时 2)看电视_______小时 8)睡觉_______小时
“C2 你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等” 赋值为“5”,为了便于分析,通过Transform-Recode into Different Variables命令将“下等”赋值为“1”,“中下等”赋值为“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。
SPSS的操作步骤如下:
打开武汉市初中生日常行为状况调查的数据data9。
依次点击Analyze→Regression→Linear,打开如图14-1(练习)所示的对话框。
图14-1(练习) Linear回归主对话框
将自变量“做作业时间c11a1”、“看电视时间c11a2”和“睡觉时间c
显示全部