软件开发人员的薪金最终.doc
文本预览下载声明
PAGE
PAGE 16
软件开发人员的薪金
摘要
本问题是一个多元线性回归模型,通过建立线性回归模型,从而确定该软件开发公司付给雇员的薪金与资历、管理水平、教育水平之间的定量关系。结合题目所给的以往数据,运用多元线性回归的方法求出了软件开发人员的薪金与资历、管理水平、教育水平之间的线性回归方程。同时运用逐步回归法确立了影响软件开发人员薪金的显著因素,得出了影响软件开发人员薪金因素的最佳多元回归模型。并对回归方程和各个因素进行了显著性检验。
对于该问题所得的多元线性回归方程,(其中、、、为带估计的回归系数,为随机误差,、、分别为资历、管理水平和教育程度)我们采取了最小二乘法中的多项式曲线拟合,结合题目所给的经验数据,得出了影响软件开发人员薪金的较优多元回归方程,。在得出初步的回归方程后,我们对方程进行了改进,得出了该模型的较准确的解
关键词:多元线性回归 多项式曲线拟合 逐步回归
问题重述
一家软件公司的雇员的基本薪金既取决于他们的资历和教育程度,也与他们所负责的工作岗位有关,人事总监希望建立一个薪金与这些因素之间的定量关系,从而对于新聘雇员的底薪做到心中有数。
人事部为研究软件开发人员的薪金与他们的资历、管理水平、教育水平等因素之间的关系,要建立一个数学模型,以便分析公司人事部策略的合理性,并作为新聘用人员薪金的参考。他们认为目前公司人员的薪金总体上是合理的,可以作为建模的依据,于是调查了46名软件开发人员的档案资料,如表1,其中资历一列指从事专业工作的年数,管理水平一列中1表示管理人员,0表示非管理人员,教育水平一列中1表示中学水平,2表示大学水平,3表示研究生水平。
表1:
编号
薪金
资历
管理水平
教育水平
编号
薪金
资历
管理水平
教育水平
(元)
(年)
(元)
(年)
1
13876
1
1
1
24
2284
6
1
2
2
11608
1
0
3
25
16978
7
1
1
3
18701
1
1
3
26
14803
8
0
2
4
11283
1
0
2
27
17404
8
1
1
5
11767
1
0
3
28
22184
8
1
3
6
20872
2
1
2
29
13548
8
0
1
7
11772
2
0
2
30
14467
10
0
1
8
10535
2
0
1
31
15942
10
0
2
9
12195
2
0
3
32
23174
10
1
3
10
12313
3
0
2
33
23780
10
1
2
11
14975
3
1
1
34
25410
11
1
2
12
21371
3
1
2
35
14861
11
0
1
13
19800
3
1
3
36
16882
12
0
2
14
11417
4
0
1
37
24170
12
1
3
15
20263
4
1
3
38
15660
13
0
1
16
13231
4
0
3
39
26330
13
1
2
17
12884
4
0
2
40
17646
14
0
2
18
13245
5
0
2
41
25685
15
1
3
19
13677
5
0
3
42
27837
16
1
2
20
15965
5
1
1
43
18838
16
0
2
21
12366
6
0
1
44
17483
16
0
1
22
21352
6
1
3
45
19207
17
0
2
23
13839
6
0
2
46
19346
20
0
1
符号说明
: 软件开发人员的薪金;
: 回归系数;(=0、1、2、3);
: 软件开发人员的资历;
: 软件开发人员的管理水平;
: 软件开发人员的教育水平;
: 随机误差;
: 回归系数的样本估计值;
:回归系数的区间估计;
: 残差;
:置信区间;
:用于检验回归模型的统计量,有三个数值:相关系数、值、与对应的概率
模型假设
(1)薪金自然随着资历(年)的增长而增加;
(2)管理人员的薪金应高于非管理人员;
(3)教育程度越高薪金也越高;
(4)管理责任、教育程度、资历诸因素之间没有交互作用;
(5)资历(年)、管理水平、教育程度分别对薪金的影响是线性的;
(6)目前公司软件开发人员的薪金是合理的。
(7)在模型改进中我们假设资历(年)、管理水平、教育程度之间存在交互作用
模型的建立与求解
(一)、多元线性回归模型
设有个可能的因素影响最后的预测结果,则该线性模型可记为: (1)
则当给出(,,…., ;)的个可能因素的组样本(,,…, ; =1,2,3,…,n),就可以利用最小二乘法求得参数,,…, 的最小二乘估计,,…,的估计值,进而求得回归方程:
(
显示全部