实验一.多元分析方法.doc
文本预览下载声明
班级: 信息000 学号:200612030000姓名: 实验组别:
实验日期: 2015.6 报告日期: 2015.7.14 成绩:
报告内容:(目的和要求、原理、步骤、数据、计算、小结等)
实验名称:多元统计分析方法
实验目的
统计分布是用来刻画随机变量特征及规律的重要手段,是进行统计分布的基础和提高。多元统计分析方法则是建立在多元统计分布基础上的一类处理多元统计数据方法的总称,是统计学中的具有丰富理论成果和众多应用方法的重要分支。在本文中,我们将对多元统计分析方法做一个大体的描述,并通过一部分实例来进一步了解多元统计分析方法的具体实现过程。
二、 多元统计分析方法的研究对象和主要内容
(一)多元统计分析方法的研究对象
由于大量实际问题都涉及到多个变量,这些变量又是随机变量,所以要讨论多个随机变量的统计规律性。多元统计分析就是讨论多个随机变量理论和统计方法的总称。其内容包括一元统计学中某些方法的直接推广,也包括多个随即便量特有的一些问题,多元统计分析是一类范围很广的理论和方法。
(二)多元统计分析方法的主要内容
从形式上,常用多元统计分析方法可划分为两类:
一类属于单变量常用的统计方法在多元随机变量情况下的推广和应用,如多元回归分析,典型相关分析等;
另一类是对多元变量本身进行研究所形成的一些特殊方法。如主成分分析,因子分析,聚类分析,判别分析,对应分析等。
三、各种多元统计分析方法
具体来说,常用的多元统计分析方法主要包括:多元回归分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析等。下面我们对各种多元统计分析方法就行分别描述,
(一) 回归分析
回归分析是最灵活最常用的统计分析方法之一,它用于分析一个因变量与一个或多个自变量之间的关系。特别是用于:(1)定量的描述和解释相互关系;(2)估测或预测因变量的值。
多元回归分析是研究因变量Y与m个自变量的相关关系 ,而且总是假设因变量Y为随机变量,而为一般变量。
下面我们来看一下多元线性回归模型的建立。
假定因变量Y与线性相关。收集到的n组数据()(t=1,2,···n)满足以下回归模型:
并称它们为经典多元回归模型,其中Y是可观测的随机向量,是不可观测的随机向量,C是已知矩阵,是未知参数,并设nm,且rank(C)=m+1。
我国国内生产总值与基本建设投资额的大小有密切关系,研究发现两变量之间存在线性关系。根据甘肃省1990-2003年的国内生产总值与基本建设投资额数据,研究它们的数量规律性,探讨甘肃省基本建设投资额与国内生产总值的数量关系,原始数据见下表。
年份 GDP(亿元) 基本建设投资(亿元) 1990 242.8 29.04 1991 271.39 33.96 1992 317.79 39.22 1993 372.24 42.89 1994 451.66 58.19 1995 553.35 62.62 1996 714.18 101.42 1997 781.34 121.74 1998 869.75 157.14 1999 931.98 187.49 2000 983.36 208.28 2001 1072.51 228.63 2002 1161.43 263.06 2003 1304.6 307.3 利用excel进行分析,具体输出以下数据,
平方和 自由度 方 差 F 检验值 回归 1553189.7 1 1553189.7 残差 59475.667 12 4956.3056 313.3765001 离差 1612665.4 13 复 相 关 系 数 R =.981386594345333 剩 余 标 准 差 SY =70.4010340269248 回归方差与剩余方差之比 F =313.376500123223 各个自变量的 t 检验值 17 t 检验的自由度 N-P-1 =12 F 检验的自由度 第一自由度=1,第二自由度=12 各个自变量的偏回归平方和 1553189.7 各个自变量的偏相关系数 0.981386594 由输出结果,得以下结论:
回归方程为 y=232.70+3.68
其中,负相关系数为=0.9814,说明回归方程拟合优度较高。而回归系数的t=17.7024,查t分布表,小于t值,因此回归系数显著。查F分布表,4.75,由下表知,F=313.37654.
显示全部