地理信息系统 第五章 地理信息系统的空间分析功能2.pdf
5.4空间变量的统计分析
5.4.1相关分析
1.空间变量相关的意义
所谓相关,是指两个或两个以上变量间相互关系是否密切。相
关分析仅限于测定两个或两个以上变量具有相关关系者,其主要目的
是计算出两个或两个以上变量间的相关程度和性质。
在地理信息系统中,被研究的空间变量存在着各种不同的关系。
一种是确定性的关系,即函数关系。由于地学中的研究对象或多或少
具有随机性的缘故,所以,这种关系在地学研究中较为少见。另一种
是相关关系,即研究变量间存在着一定的关系。但这种关系中的一个
变量值不能精确地由其它变量的值计算出。以图5-26为例说明即为:
假设x和y为两种空间研究变量。在图5-26(a)、(b)中,y严格
随x的变化而变化,称x和y完全相关,满足函数关系。在图5-26(c)、
(d)中,通过空间变量确定的点分布在曲线或直线两旁,则表示两个
变量间具有相关关系,或称为统计相关。在图5-26(e)中,如果通过
空间变量确定的点的分布状态散乱,无规律可寻,则表示空间研究变
量间相互独立,没有依存关系。
图5-26空间变量关系图
2.相关程度的度量方法
162
下面将要介绍的是如何判断两个变量间的线性相关关系。判断变
量间的线性相关关系是通过相关程度和相关方向来加以表达的。
(1)相关程度是研究变量间相互关系的密切程度;
(2)相关方向又分为正相关和负相关两种。正相关是表示两个变
量间呈现同方向变化的相关,y随x的增大而增大,减少而减少。负
相关表示两个变量间呈现反方向变化的相关,y随x的增大而减少,
减少而增大。
定量表达线性相关程度和方向的指标为相关系数。常用相关系数
的计算公式如下:
r(xix)(yiy)(5-23)
_
_
(xix)2(yiy)2
利用式(5-23)计算出的相关系数具有以下性质:
(1)1r1;
(2)当相关系数为正数时,表示两个变量之间为正相关,相关系
数为负值时,表示两个变量间为负相关;
(3)相关系数的绝对值越大,表示两个变量间的相关程度越密切。
当相关系数为1时,为完全正相关;相关系数为-1时,为完全负相
关;相关系数为0时,则完全无关。
5.4.2回归分析
回归分析是处理变量之间具有相关关系的一种数理统计方法。实
际上,回归分析和相关分析都是研究和处理变量之间具有相互关系的
一种数理统计方法,但它们之间既有联系,又有区别。在研究对象和
内容上两者是相同的,但相关分析主要是研究要素之间的密切程度,
并没有严格的自变量和因变量之分;而回归分析则主要是研究变量之
间的数学表达形式,因而有自变量和因变量之分,可以通过自变量的
值来预测、内插因变量的取值。从这里可以看出,回归分析有预测的
性质。
回归分析的主要内容可概括如下:
(1)从一组空间数据出发,确定这些变量间的定量数学表达式,
即回归方程;
(2)根据一个或几个变量的值来预测或控制另一个变量的取值;
163
(3)从影响某一地学过程的许多变量中,找出那些变量是主要的,
那些变量是次要的,这些变量之间又有什么关系。
根据变量的多少,可以把回归分析分为一元回归模型和多元回归
模型。变量之间的关系有的是线性关系,有的是非线性关系。下面将
对一元线性回归模型作较为详细的介绍,并对多元线性回归模型,逐
步回归模型和基于动态数据处理的自回归模型作简单的介绍。
1