空间统计分析.ppt
第七章空间统计分析;统计分析是空间分析的主要手段,贯穿于空间分析的各个主要环节。空间统计分析方法不仅仅限于常规统计方法,还包括利用空间位置的空间自相关分析。本章主要介绍常用统计量、数据特征分析〔即探索性数据分析〕、分级统计分析、空间插值和空间回归分析5方面内容。;第一节概述;数据的空间统计分析是直接从空间物体的空间位置、联系等方面出发,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象。
数据的空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。
空间统计分析的任务就是运用有关的统计分析方法,建立空间统计模型,从凌乱的数据中挖掘空间自相关和空间变异规律。;数据的空间统计分析与经典统计分析方法的关系;注意:在使用任何统计分析分析方法分析和空间位置有关的数据之前,我们都必须先测度和检验空间自相关的显著性。
这是因为如果所研究的空间数据具有空间自相关性,那么观测样本可能会包含相似的信息,从而导致有效样本容量的减小。相似或者自相关的观测单位会使变量间的关系重复或被夸大。;第二节根本统计量;描述地理数据一般水平指标的选择
当数据为对称分布或接近对称分布时,应选择平均数作为集中趋势的代表值,因为此时均值与众数、中位数的差异很小,而且平均数综合考虑了全部数据,具有很好的代表性。
当数据呈偏态分布时,由于均值考虑了所有观察值,因此容易受极端数值的影响,而众数又缺乏良好的数学性质,依分组求得的众数不够精确,所以此时多项选择用中位数作为描述集中性趋势的统计量。
当变量为名义尺度数据时通常只能用众数来描述集中趋势。;2.2代表数据离散程度的统计量
代表数据离散程度的统计量包括最大值、最小值、分位数、极差、离差、平均离差、离差平方和、方差、标准差、变差系数等。
离散程度越大,数据波动性越大,以小样本数据代表数据总体的可靠性越低。;2.3代表数据分布形态的统计量
代表数据离散程度的统计量主要有偏度系数和峰度系数。;图1偏度系数的三种情形;图2标准峰度系数的三种情形
;第三节探索性数据分析;3.1根本分析工具;1用直方图检验数据的分布
1〕在ArcMap目录表中单击需要进行数据检测分析的点要素层。
2〕单击GeostatisticalAnalyst模块的下拉箭头选择ExploreData并单击Histogram;2用QQPlot图检验数据的分布
1〕NormalQQplot检验数据是否符合正态分布:单击GeostatisticalAnalyst模块的下拉箭头选择ExploreData并单击NormalQQplot
2〕generalQQplot评估两个数据集分布的相似性:单击GeostatisticalAnalyst模块的下拉箭头选择ExploreData并单击generalQQplot;3Voronoi图
单击GeostatisticalAnalyst模块的下拉箭头选择ExploreData并单击Voronoi图。
Voronoi图中多边形值的几种分配方式和计算方法〔见课本273页〕;使用ARCGIS进行探索性数据分析;半变异函数和协方差函数把统计相关系数的大小作为一个距离的函数,如果分别以h为横坐标,变异函数γ(0)或协方差函数C〔h〕为纵坐标,就得到了变异函数曲线图和协方差函数图:;协方差函数和半变异函数随着距离的加大根本呈反向变化特征,它们之间的近似关系表达式为:;在半变异曲线图中有两个非常重要的点:间隔为0时的点和半变异函数趋近平稳时的拐点,由这两个点产生四个相应的参数:块金值〔Nugget〕、变程〔Range〕、基台值〔Sill〕、偏基台值〔PartialSill〕;※理论上,当采样点间的距离为0时,半变异函数值应为0,但由于存在测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为0,即存在块金值。测量误差是仪器内在误差引起的,空间变异是自然现象在一定空间范围内的变化。它们任意一方或两者共同作用产生了块金值。
;※当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不存在。;※在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当hR时,区域化变量Z(x)的空间相关性不存在,即当某点与点的距离大于变程时,该点数据不能用于内插或外推。;3.2检验数据分布;3