对财政支出数据的回归分析概要.doc
文本预览下载声明
应用回归分析论文
题目:影响财政支出因素的应用回归分析
姓 名: 孙天阳
学 号:
摘 要
截取了中国国家统计局统计年鉴中的财政支出数据,主要是对影响财政支出的因素进行分析,因为,财政支出的情况也在一定程度上反映了我国当前时段内的经济和社会情况。
选取了各地区财政2008年的支出情况数据,对其做多元线性分析,建立回归模型,并通过对回归系数做显著性检验与逐步回归来分析数据。最后的结果就体现了各地财政支出与教育,国防,等的关系。
关键词;逐步回归、显著性检验
模型
1、多元线性回归的模型表示
矩阵表达
2、估计
最小二乘估计要寻找
经过整理得到回归参数的最小二乘估计就是
3.显著性检验
(1)、F检验
H0:β1=β2=…=βp=0
SST = SSR + SSE
当H0成立时服从
(2)、回归系数的显著性检验
H0j:βj=0, j=1,2,…,p
~N(β,σ2(X'X)-1)
记 (X'X)-1=(cij) i,j=0,1,2,… ,p
构造t统计量
其中
4、逐步回归
(1)前进法
前进法的思想是变量由少到多,每次增加一个,直至没有可引入的变量为止。首先分别对因变量y建立m个一元线性回归方程,并分别计算这m个一元回归方程的m个回归系数的F检验值,记为,选其最大者记为:
给定显著性水平α,若≥Fα(1,n-2),则首先将xj引入回归方程,为方便,设xj就是x1。
接下来因变量y分别与 (x1,x2),(x1,x3),…,(x1,xm)建立m-1个
二元线性回归方程,对这m-1个回归方程中x2,x3,…,xm的回归系数进行
F检验,计算F值,记为,选其最大的记为:
若≥Fα(1,n-3),则接着将xj引入回归方程。
(2)后退法
后退法与前进法相反,首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。设对m个回归系数进行F检验,记求得的F值为,选其最小者记为:
给定显著性水平α,若≤Fα(1,n-m-1),则首先将xj从回归方程中剔除,为方便,设xj就是xm。
接着对剩下的m-1个自变量重新建立回归方程,进行回归系数的显著性检验,像上面那样计算出,如果又有≤Fα(1,n-(m-1)-1),则剔除xj,重新建立y关于m-2个自变量的回归方程,依此下去,直至回归方程中所剩余的p个自变量的F检验值均大于临界值Fα(1,n-p-1),没有可剔除的自变量为止。这时,得到的回归方程就是最终确定的方程。
(3)逐步回归法
逐步回归的基本思想是“有进有出”。具体做法是将变量一个一个引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后所得的回归子集是“最优”回归子集。
在逐步回归中需要注意的一个问题是引入自变量和剔除自变量的显著性水平α值是不相同的,要求
α进α出
否则可能产生“死循环”。也就是当α进≥α出时,如果某个自变量的显著性P值在α进与α出之间,那末这个自变量将被引入、剔除、再引入、再剔除、…,循环往复,以至无穷。Y 一般预算支出 X1 一般公共服务 X2 国防
X3 公共安全
X4 教育
X5 科学技术
X6文化体育与传媒
X7社会保障与就业
X8医疗卫生
X9环境保护
X10城乡社区事务
X11农林水事务
X12交通运输
2、结果数据及分析
表一
以上是参数估计的结果,建立回归方程
(1方程的系数检验:
表二
方差分析的结果。P0.05,证明高度显著,即变量全体x1-x12对y有显著影响,但是我们不能确定没一个变量x都对y有显著性。由表一中我们可以看出诸如x2,x3,x4,x5,等都没有通过检验的t统计量及相应的P值,得到,并不是每一个单独的对因变量y都有显著性影响,这说明尽管回归方程通过了显著性检验,但也出现某些单个变量对y并不显著的情况。
表三
表三是样本相关阵的输出数据,x7等对y的贡献较大,而x2等比较小,所以我们需要剔除一些变量。
(2)异方差和自相关性检验
表四
我们可以看到在其中的值都小于.05,所以不存在异方差性。
我们看到dw=1.951,故认为不存在自相关性,我们在上表中可以看到有些变量的方差扩大因子较大,vif超过了10,所以我们认为变量间可能存在着多重共线性,我们在后面将进行变量的选择来剔除那些共线性变量。
(3后退法
取显著性水平a=0.1000.
变量剔除
由此回归子集的最优方程就是:
复决定系数是0.9910,c(p)是3.4128
(4前进法
,
我们可以看到依次
显示全部