范文一:空间统计分析实习报告
空间统计分析实习报告
实习目的:
1)学会空间数据的处理
2)综合利用各类数据,进行相关的空间分析
二、实习内容:
(1)矢量数据的拓扑差错,多幅专题地图的拼接和边缘匹配
(2)基于道路缓冲区分析和基于面状要素的缓冲区分析;
(3)基于线状和面状数据的空间分析,包括线段长度、多边形面积和最佳路径分析等内容
三、实习方案:
(1)根据分组情况以及各组专题数字化内容,在arcgis 下多幅具有统一坐标体系的数据,进行边缘匹配,完成南昌市的多幅专题地图的拼接。内容包括南昌市区的道路交通图、南昌市区绿地分布图、南昌市区的建筑物专题图、南昌市区大小湖泊水体分布图等;
(2)针对不同道路关系,设置相关拓扑关系,利用拓扑关系进行差错,如道路的相较不相交等;
四、实习心得:
在图幅拼接时,相邻的两个人所做的同一个道路或是建筑都很不一样,对拼接造成很大的问题。但利用拓扑就能解决很多问题,很方便。同时也体现不同人的思维是不一样的,所以就算同一地区,每个人做出来的效果都很不一样。
范文二:ArcGIS 做空间统计分析
§12. 使用ARCGIS 进行空间统计分析
一、软硬件环境
软件:ARCGIS8.0版本以上,需要具有Geostatistics 模块的许可; 硬件:目前主流配置即可。
二、软件及数据的准备
本例以ARCGIS9.0为软件平台,对甘肃省30年平均降水进行空间插值的。
(1)打开ARCGIS9.0,并把Geostatistics 模块加载上。首先在工具>扩展中将相应模块选中,如图1。
图1
其次,在工具条上点击右键,把Geostatistical Analyst选中,如
图2。
图2
(2)数据准备
本例需要的是各个气象站点和观测数据,所以首先需要各个气象观测站的点图层,各个站点30年观测的平均降水量、蒸发量以及该站点的海拔高程作为属性数据,附在上述点图层上。因为是对甘肃省省域内气候进行插值,因此还必须有甘肃省的省界。并过数据加载按钮将上述数据加载上,如图3所示。
图3
(3)分析数据框架设定
在Layers 上右击,点击属性,选择数据框架(Data Frame)面板,然后将甘肃省边界图层作为分析时显示的数据框架(即只显示省内区域)。如图4:
图4
三、探索性空间数据分析(ESDA)
空间插值的模型和方法有很多,通过探索性空间数据分析,目的是寻找数据内在的规律性,再根据这些规律寻找适合的空间插值模型;或者通过数据变换(例如常见的COX -BOX 变换、对数变换),使原来不适合于插值的数据可以进行插值。对于ESDA 可以说是一门学问,这里简单介绍,Geostatistical Analyst所带的几种方法,如图5。
图5
1、直方图
点击Histogram ,然后在右下选择需要分析的属性,则就显示直方图分布情况,并在右上角给出各种相关的统计指标,图6。
图6
在左下方的下拉框可以选择直方的数量,变换方法,软件提供了
两种:LOG 和Cox-Box 。
2、正则QQ 图(Normal QQPlot)
图7
3、趋势分析(Trend Analysis)
同样选择合适的属性,作为Z 轴,空间坐标作为XY 轴,则分析该属性的三维分布趋势,图8。
图8
通过选择坐标轴,和观察视角分析其分布趋势,并对在其他两个面上的投影分布趋势进行拟合,如图9。
图9
4、Voronoi 图(Voronoi Map)
即所谓的“泰森多边形”,同样选择降水量,进行分析,图10。右上角为图例,左下角通过下拉列表可以选择平均值、标准差等不同的形式进行V oronoi Map分析其空间格局特征。
图10
5、半变异函数云图(Semivariogram Cloud)
通过对半变异函数云图的分析为下面进行克立金插值半变异函数模型的选择,提供基本参考,图11。
图11
四、克立金插值
1、单要素克立金插值
(1)点击地统计向导
Arcgis的地统计分析有一个地统计向导,按照这个向导一步一步就可以实现空间产值。点击向导,图
12
图12
(2)选择输入的数据和属性,选择的插值模型,这里选择kriging 方法,图13。然后next 即可。
图13
(3)选择插值方法和数据预处理方法
克立金插值模型还包括很多方法,例如普通克立金、简单克立金、通用克立金等等,读者可以自己了解相关知识。这里选择最基本的普通克立金方法,目标是实现空间产值,所以选择预测图即可。
通过上文探索性空间数据分析指导,甘肃省各个台站的平均降水量并不符合正态分布,而且在趋势分析中存在明显的抛物线特征,这里选择相应方法对其预处理,读者也可以不选择,然后比较插值结果的精度,图14,然后next 。
图14
(4)去趋势分析(Detrending )
图15
因为半变异函数和克立金插值都要求数据的随机性,那么对于数据中存在的结构性特征如果不能消除则会影响插值精度。通过邻居数量和影响半径的选择,消除这种全局性的结构性特征。当然读者这一步可以选择系统默认设置也可以。
(4)确定半变异函数模型
这一步对插值的精度影响很大。根据左上角的半变异函数云图,在右边模型栏内,选择对其拟合较好的模型,通过可以通过调整搜寻角度和搜寻半径(左下),最终确定一个合适的模型,该模型的参数在左下角蓝色条框内给出,图16,然后next 。同样,读者可以选择默认设置。
图16
(5)搜寻邻居的调整
如图17,我们选择默认设置。
图17
(6)交叉验证结果
这一步给出了上述设置计算结果的交叉验证值,我们可以分析各种验证的精度,如果误差很大,不能通过检验,则需要重新设置。图18。
图18
(7)对上述过程的一个总结
点击finish ,会首先给出这个过程的一个总结Summary 。例如,数据预处理过程,采用的模型等。
图18
(8)得到插值的结果
图19
当然,我们可以全部都采用软件自己默认的设置,即从第(3)步开始直接点击finish ,可以得到插值的结果,对于与上面结果的差异,可以比较分析。
2、双要素的协同克立金插值
对于许多自然现象的空间格局除了受自身空间相互影响和相互作用外,还受到外部其他因素的影响,例如区域降水量和蒸发量都要受到地形条件的影响,特别是海拔高度。下面对使用海拔高度和平均降水量的双要素进行协同克立金插值,来获取区域降水量的分布图。
(1)选择方法cokriging
如下图,然后在Dataset1中选择输入的点图层,选择降水的属性值。
然后在Dataset2中选择高程所在的文件和属性,本例降水量和高程两个属性都在一个点图层上,如下图。最多可以选择四个要素,进行协同克立金插值。
(2)以下的步骤和单要素克立金插值就是相同的了,这里不在重复。
范文三:ARCGIS做空间统计分析
§12. 使用 ARCGIS 进行空间统计分析
一、软硬件环境
软件:ARCGIS8.0版本以上, 需要具有 Geostatistics 模块的许可; 硬件:目前主流配置即可。
二、软件及数据的准备
本例以 ARCGIS9.0为软件平台, 对甘肃省 30年平均降水进行空 间插值的。
(1)打开 ARCGIS9.0,并把 Geostatistics 模块加载上。首先在 工具 >扩展中将相应模块选中,如图 1。
图 1
其次,在工具条上点击右键,把 Geostatistical Analyst选中,如
图 2。
图 2
(2)数据准备
本例需要的是各个气象站点和观测数据, 所以首先需要各个气象 观测站的点图层,各个站点 30年观测的平均降水量、蒸发量以及该 站点的海拔高程作为属性数据, 附在上述点图层上。 因为是对甘肃省 省域内气候进行插值, 因此还必须有甘肃省的省界。 并过数据加载按 钮将上述数据加载上,如图 3所示。
图 3
(3)分析数据框架设定
在 Layers 上右击, 点击属性, 选择数据框架 (Data Frame) 面板, 然后将甘肃省边界图层作为分析时显示的数据框架 (即只显示省内区 域) 。如图 4:
图 4
三、探索性空间数据分析(ESDA)
空间插值的模型和方法有很多, 通过探索性空间数据分析, 目的 是寻找数据内在的规律性,再根据这些规律寻找适合的空间插值模 型;或者通过数据变换(例如常见的 COX -BOX 变换、对数变换) , 使原来不适合于插值的数据可以进行插值。 对于 ESDA 可以说是一门 学问, 这里简单介绍, Geostatistical Analyst所带的几种方法, 如图 5。
图 5
1、直方图
点击 Histogram ,然后在右下选择需要分析的属性,则就显示直 方图分布情况,并在右上角给出各种相关的统计指标,图 6。
图 6
在左下方的下拉框可以选择直方的数量, 变换方法, 软件提供了
两种:LOG 和 Cox-Box 。
2、正则 QQ 图(Normal QQPlot)
图 7
3、趋势分析(Trend Analysis)
同样选择合适的属性, 作为 Z 轴, 空间坐标作为 XY 轴, 则分析 该属性的三维分布趋势,图 8。
图 8
通过选择坐标轴, 和观察视角分析其分布趋势, 并对在其他两个 面上的投影分布趋势进行拟合,如图 9。
图 9
4、 Voronoi 图(Voronoi Map)
即所谓的“泰森多边形” ,同样选择降水量,进行分析,图 10。 右上角为图例, 左下角通过下拉列表可以选择平均值、 标准差等不同 的形式进行 V oronoi Map分析其空间格局特征。
图 10
5、半变异函数云图(Semivariogram Cloud)
通过对半变异函数云图的分析为下面进行克立金插值半变异函 数模型的选择,提供基本参考,图 11。
图 11
四、克立金插值
1、单要素克立金插值
(1)点击地统计向导
Arcgis的地统计分析有一个地统计向导,按照这个向导一步一步就 可以实现空间产值。点击向导,图
12
图 12
(2) 选择输入的数据和属性, 选择的插值模型, 这里选择 kriging 方法,图 13。然后 next 即可。
图 13
(3)选择插值方法和数据预处理方法
克立金插值模型还包括很多方法, 例如普通克立金、 简单克立金、 通用克立金等等, 读者可以自己了解相关知识。 这里选择最基本的普 通克立金方法,目标是实现空间产值,所以选择预测图即可。
通过上文探索性空间数据分析指导, 甘肃省各个台站的平均降水 量并不符合正态分布, 而且在趋势分析中存在明显的抛物线特征, 这 里选择相应方法对其预处理, 读者也可以不选择, 然后比较插值结果 的精度,图 14,然后 next 。
图 14 (4)去趋势分析(Detrending )
图 15
因为半变异函数和克立金插值都要求数据的随机性, 那么对于数 据中存在的结构性特征如果不能消除则会影响插值精度。 通过邻居数 量和影响半径的选择, 消除这种全局性的结构性特征。 当然读者这一 步可以选择系统默认设置也可以。
(4)确定半变异函数模型
这一步对插值的精度影响很大。根据左上角的半变异函数云图, 在右边模型栏内, 选择对其拟合较好的模型, 通过可以通过调整搜寻 角度和搜寻半径(左下) ,最终确定一个合适的模型,该模型的参数 在左下角蓝色条框内给出,图 16,然后 next 。同样,读者可以选择 默认设置。
图 16
(5)搜寻邻居的调整
如图 17,我们选择默认设置。
图 17
(6)交叉验证结果
这一步给出了上述设置计算结果的交叉验证值, 我们可以分析各 种验证的精度,如果误差很大,不能通过检验,则需要重新设置。图 18。
图 18 (7)对上述过程的一个总结
点击 finish ,会首先给出这个过程的一个总结 Summary 。例如, 数据预处理过程,采用的模型等。
图 18
(8)得到插值的结果
图 19
当然,我们可以全部都采用软件自己默认的设置,即从第(3) 步开始直接点击 finish ,可以得到插值的结果,对于与上面结果的差 异,可以比较分析。
2、双要素的协同克立金插值
对于许多自然现象的空间格局除了受自身空间相互影响和相互 作用外, 还受到外部其他因素的影响, 例如区域降水量和蒸发量都要 受到地形条件的影响, 特别是海拔高度。 下面对使用海拔高度和平均 降水量的双要素进行协同克立金插值,来获取区域降水量的分布图。 (1)选择方法 cokriging
如下图, 然后在 Dataset1中选择输入的点图层, 选择降水的属性 值。
然后在 Dataset2中选择高程所在的文件和属性, 本例降水量和高 程两个属性都在一个点图层上,如下图。最多可以选择四个要素,进 行协同克立金插值。
(2)以下的步骤和单要素克立金插值就是相同的了,这里不在 重复。
范文四:利用ARCGIS进行空间统计分析
§12. 使用ArcGIS 进行空间统计分析
一、软硬件环境
软件:ArcGIS 8.0版本以上,需要具有Geostatistics 模块的许可; 硬件:目前主流配置即可。
二、软件及数据的准备
本例以ArcGIS 9.0为软件平台,对甘肃省30年平均降水进行空间插值的。
(1)打开ArcGIS 9.0,并把Geostatistics 模块加载上。首先在工具>扩展中将相应模块选中,如图1。
图1
其次,在工具条上点击右键,把Geostatistical Analyst 选中,如
图2。
图2
(2)数据准备
本例需要的是各个气象站点和观测数据,所以首先需要各个气象观测站的点图层,各个站点30年观测的平均降水量、蒸发量以及该站点的海拔高程作为属性数据,附在上述点图层上。因为是对甘肃省省域内气候进行插值,因此还必须有甘肃省的省界。并过数据加载按钮将上述数据加载上,如图3所示。
图3
(3)分析数据框架设定
在Layers 上右击,点击属性,选择数据框架(Data Frame)面板,然后将甘肃省边界图层作为分析时显示的数据框架(即只显示省内区域)。如图4:
图4
三、探索性空间数据分析(ESDA )
空间插值的模型和方法有很多,通过探索性空间数据分析,目的是寻找数据内在的规律性,再根据这些规律寻找适合的空间插值模型;或者通过数据变换(例如常见的COX -BOX 变换、对数变换),使原来不适合于插值的数据可以进行插值。对于ESDA 可以说是一门学问,这里简单介绍,Geostatistical Analyst所带的几种方法,如图5。
图5
1、直方图
点击Histogram ,然后在右下选择需要分析的属性,则就显示直方图分布情况,并在右上角给出各种相关的统计指标,图6。
图6
在左下方的下拉框可以选择直方的数量,变换方法,软件提供了
两种:LOG 和Cox-Box 。
2、正则QQ 图(Normal QQPlot)
图7
3、趋势分析(Trend Analysis)
同样选择合适的属性,作为Z 轴,空间坐标作为XY 轴,则分析该属性的三维分布趋势,图8。
图8
通过选择坐标轴,和观察视角分析其分布趋势,并对在其他两个面上的投影分布趋势进行拟合,如图9。
图9
4、Voronoi 图(Voronoi Map)
即所谓的“泰森多边形”,同样选择降水量,进行分析,图10。右上角为图例,左下角通过下拉列表可以选择平均值、标准差等不同的形式进行V oronoi Map分析其空间格局特征。
图10
5、半变异函数云图(Semivariogram Cloud)
通过对半变异函数云图的分析为下面进行克立金插值半变异函数模型的选择,提供基本参考,图11。
图11
四、克立金插值
1、单要素克立金插值
(1)点击地统计向导
ArcGIS 的地统计分析有一个地统计向导,按照这个向导一步一步就可以实现空间产值。点击向导,图
12
图12
(2)选择输入的数据和属性,选择的插值模型,这里选择kriging 方法,图13。然后Next 即可。
图13
(3)选择插值方法和数据预处理方法
克立金插值模型还包括很多方法,例如普通克立金、简单克立金、通用克立金等等,读者可以自己了解相关知识。这里选择最基本的普通克立金方法,目标是实现空间产值,所以选择预测图即可。
通过上文探索性空间数据分析指导,甘肃省各个台站的平均降水量并不符合正态分布,而且在趋势分析中存在明显的抛物线特征,这里选择相应方法对其预处理,读者也可以不选择,然后比较插值结果的精度,图14,然后Next 。
图14
(4)去趋势分析(Detrending )
图15
因为半变异函数和克立金插值都要求数据的随机性,那么对于数据中存在的结构性特征如果不能消除则会影响插值精度。通过邻居数量和影响半径的选择,消除这种全局性的结构性特征。当然读者这一步可以选择系统默认设置也可以。
(5)确定半变异函数模型
这一步对插值的精度影响很大。根据左上角的半变异函数云图,在右边模型栏内,选择对其拟合较好的模型,通过可以通过调整搜寻角度和搜寻半径(左下),最终确定一个合适的模型,该模型的参数在左下角蓝色条框内给出,图16,然后Next 。同样,读者可以选择默认设置。
图16
(6)搜寻邻居的调整
如图17,我们选择默认设置。
图17
(7)交叉验证结果
这一步给出了上述设置计算结果的交叉验证值,我们可以分析各种验证的精度,如果误差很大,不能通过检验,则需要重新设置。图18。
图18
(8)对上述过程的一个总结
点击Finish ,会首先给出这个过程的一个总结Summary 。例如,数据预处理过程,采用的模型等。
图18
(9)得到插值的结果
图19
当然,我们可以全部都采用软件自己默认的设置,即从第(3)步开始直接点击Finish ,可以得到插值的结果,对于与上面结果的差异,可以比较分析。
2、双要素的协同克立金插值
对于许多自然现象的空间格局除了受自身空间相互影响和相互作用外,还受到外部其他因素的影响,例如区域降水量和蒸发量都要受到地形条件的影响,特别是海拔高度。下面对使用海拔高度和平均降水量的双要素进行协同克立金插值,来获取区域降水量的分布图。
(1)选择方法cokriging
如下图,然后在Dataset1中选择输入的点图层,选择降水的属性值。
然后在Dataset2中选择高程所在的文件和属性,本例降水量和高程两个属性都在一个点图层上,如下图。最多可以选择四个要素,进行协同克立金插值。
(2)以下的步骤和单要素克立金插值就是相同的了,这里不在重复。
范文五:实验三 空间统计分析
实验二 空间统计分析
一、实验背景
随着社会的飞速发展,GIS 在各个领域的应用也不断扩展,特别是在流行病学、生物学、气象、地质等这些特殊的行业中,需要更深入的挖掘空间数据信息。传统的GIS 分析侧重于研究空间要素之间的关系,如相邻、叠加、以及要素之间的距离、连通性等,而这些特殊行业需要的则是根据多种采样的数据来研究空间事物的变化特征、分布特征等信息。这些信息通常是一种统计分析的结果,而在空间上,事物的分布又是相互关联的。所以,空间统计应运而生。
二、实验目的
1、理解空间统计的含义,熟练利用ArcGIS9.3中的Spatial Statistics Tools进行空间统计相关操作,并理解其相关理论。
2、通过对ArcGIS9.3中Spatial Statistics Tools中部分功能的探索,培养学生利用ArcGIS 帮助文件及其它相关资料独立学习的能力。
三、实验数据
1. 全国县域点状矢量数据——countypoint.shp
2. 美国俄亥俄州县域面状矢量数据——ohcounties.shp
实验数据下载地址:ftp://ciee.cau.edu.cn /空间分析实验课件
四、实验内容
所谓空间统计,就是将空间信息与属性信息进行统一的考虑,研究特定属性或属性之间与空间位置的关系。空间统计主要的工作是研究空间自相关性(Spatial Autocorrelation ),分析空间分布的模式,例如聚类(cluster )或离散(dispersed )。
空间分布模式分析(Analyzing Patterns)
对于理解地理现象以及解决地理问题来说,识别地理模式是非常重要的。尽管可以通过对要素绘图来了解它们的总体模式及其关联值,但通过计算统计数据能够将模式量化,更便于比较不同分布方式或不同时段的模式。通过使用空间分布模式分析工具集,可以评估要素(或与要素关联的值)是形成一个聚类空间模式、离散空间模式还是随机空间模式。
1. 平均最近邻点距离(Average Nearest Neighbor)
最近邻点统计量最早是由Clark 和Evans (1954)这两位植物学家提出的,是基于各点与最靠近它的点之间距离的平均值计算出来的。
1) 基本原理
R 统计量(有时也称为R 比率)是点分布中最近邻点平均距离的观测值与期望值之比,也可以称为最近邻点统计量。
R =r obs (式1-1) r exp
其中,r obs 是最近邻点平均距离的观测值,r exp 是由理论模式决定的最近邻点平均距离的期望值。
理论模式:如果将某一均质区域划分成一组大小相同的正六边形,那么由每个六边形中心处的点构成的点模式就是最规则的模式(即三角网模式)。在此模式中,各点之间的距离将等于1. 075A /n ,其中A 为区域面积,n 为点数。
计算r obs 时,先计算每个点与所有其他点之间的距离。每个点与其各邻点之间的最近距离就是该点与其最近邻点之间的距离。对所有的点重复这一计算过程。
r obs =d
n i (式1-2)
其中,d i 为第i 个点的最近邻点距离,n 为点数。
对于理论上的随机模式,用r exp =1
2n /A 计算平均最近邻点距离即为平均最近邻点距
离的期望值,其中A 为区域面积,n 为点数。如果R >1,即r obs >r exp ,则表明观测模式比随机模式分散;如果R <1,即r obs="">1,即r>
衡量平均距离的观测值与期望值之间差异程度的方法,是将它们的差异与最近邻点平均距离的标准误差(SE r )进行比较。
SE r =0. 26136
r obs -r exp
SE r A (式1-3) n 2 (式1-4) Z R =
标准化Z 值,如果Z R >1. 96或Z R <-1. 96,我们就可以认为在α="0.">-1.>
2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools → Analyzing Patterns → Average Nearest Neighbor 即可弹出Average Nearest Neighbor对话框,如图1-1所示。
A. Input Feature Class:输入要素类;
B. Distance Method :指定计算距离的方法,Euclidean Distance 欧几里得距离,Manhattan
Distance 曼哈顿距离——是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点上在标准坐标系上的绝对轴距总和;
C. Display Output Graphically可选框,设定为TRUE 时,则以图形方式显示最近邻域指数;
D. Area (optional )指定最近邻域分析的范围,输入类型为double 型,输入的数值代表研
究区的大小,默认值是能覆盖该地区所有要素(或者是选中的所有要素)的最小包络矩形,单位应当和输出的坐标系统的单位匹配。
图1-1 Average Nearest Neighbor对话框
3) 实例应用
以全国3407个县的点文件为例,计算距离采取曼哈顿距离方法,指定分析范围为默认值,此处的单位与坐标系统的单位一致(如图1-2)。
图1-2 实例应用之设置参数-R 统计量
图1-3 文字方式显示计算结果-R 统计量
其中,P 值(弃真概率)为第一类错误即在原假设是正确的情况下,拒绝其所犯错误的概率。
图1-4 图示方式显示计算结果-R 统计量
其中,Standard deviations-标准误差;Significance level-显著性水平;Critical Value-临界值。 Q1:以全国3407个县的点文件为例,计算距离采取曼哈顿距离方法,指定分析范围分别取为默认值和30平方米,对得出的分析结果进行说明和比较。
2. 高值/低值聚集(High/Low Clustering)-
广义G 统计量(Getis and Ord,1992)是一个全局空间自相关统计量,测量研究区的聚集度。与Moran’s I 和Geary’s C 相比,它的优势在于能够探测整个研究区域内是否存在热点和冷点。
1) 基本原理
在空间聚集分析中,较高的值的局部聚集称为热点,而较低的值彼此靠近所形成的局部聚集则称为冷点。计算公式如下:
w (d ) x x G (d ) =x x ij i
i j j ,其中i ≠j (式1-5)
其中,x i ,x j 是单元i 与j 的属性,w ij (d ) 是通过距离函数或者说距离标准为d 的邻接函数来确定的权重,如果区域单元i 与j 之间的距离小于d ,权重w ij (d ) 就等于1,否则就等于0。一般来说,相邻值越大,决定G (d ) 统计量大小的分子就相对越大;相邻值越小,分子就越小,得到相对较小的G (d ) 值,表明低值与低于平均水平的值空间关联。因此,G (d ) 统计量能够探测高值(热点)和低值(冷点)的聚集。
为了得到z 值并对广义G 统计量的显著性进行检验,需知道G (d ) 的期望值及方差。G (d ) 的期望值是指区域单元之间不存在显著地空间关联时的G (d ) 值。
E (G ) =W (式1-6) n (n -1)
G (d ) 的方差为:Var (G ) =E (G 2) -[E (G )]2,其中
E (G 2) =1224[B m +B m +B m m +B m m +B m ] (式1-7) 02142123134122(4) (m 1-m 2) n
i =1n (x ) =n ?(n -1) ?(n -2) ?(n -3) ? ?(n -x +1) ,m j =∑x i j (式1-8,9)
B 0=(n 2-3n +3) S 1-nS 2+3W 2,B 1=-[(n 2-n ) S 1-2nS 2+3W 2](式1-10,11) B 2=-[2nS 1-(n +3) S 2+6W 2],B 3=4(n -1) S 1-2(n +1) S 2+8W 2(式1-12,13)
B 4=S 1-S 2+W 2,S 1=1(w ij +w ji ) 2 (式1-14,15) ∑∑2i j
j S 2=∑(∑w ij +∑w ji ) 2 (式1-16)i j
G (d ) 的标准化Z 值为:
Z (G ) =G -E (G )
(G ) (式1-17)
2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools → Analyzing Patterns → High/Low Clustering (Getis-Ord General G)即可弹出High/Low Clustering(Getis-Ord General G)对话框,如图1-5所示。
A. Input Feature Class:输入要素类;
B. Input Field:用于测量聚集度的字段;
C. Display Output Graphically 可选框,设定为TRUE 时,则以图形方式显示Getis-Ord
General G和Z 值;
D. Conceptualization of Spatial Relationships:要素间的关联方式
? Inverse Distance(反距离)-所有的要素对其他的要素都有影响,但是越远的的要素
影响越小,越近的要素影响越大。
? Inverse Distance Squared(反距离平方)-跟反距离类似,但是加大了之间的差距,
就是最邻近的要素影响最大,将其权重扩大化。
? Fixed Distance Band(二值法)-在规定的的距离内,要素之间有影响,而一旦超出
了这个范围,则要素之间的影响为0.
? Zone of Indifference(综合法)-兼顾使用了二值判别和反距离判断,在阈值内为1,
超过一定阈值后呈反距离衰减。
? Polygon Contiguity (First Order)(邻接多边形(一阶))-将空间上具有公共边界的多
边形认为是相邻的,并赋予权重1;否则为0。
? Get Spatial Weights From File(从文件中获取空间权重)-该文件是空间权重矩阵文
件,该文件定义了要素间的空间关系。如果选择此项,则Weights Matrix File中需要选择已经存在的一个空间权重矩阵文件。
图1-5 High/Low Clustering(Getis-Ord General G)对话框
E. Distance Method(指定计算距离的方法):Euclidean Distance欧几里得距离,Manhattan
Distance 曼哈顿距离;
F. Standardization :权重标准化的方式,以提供更精确的结果,None 表示无标准化,Row
表示行标准化空间权重;
G. Distance Band or Threshold Distance:指定距离阈值,超过阈值的要素在聚类分析中会被
忽略。当关联方式选择反距离和二值法时,需要在此设定距离。当此参数留空,默认阈值将被计算和应用。当设置为“邻接多边形”或“从文件获取空间权重”时,该参数不会影响计算。
H. Weights Matrix File(optional ):空间权重矩阵文件。可用ArcGIS9.3中的Spatial Statistics
Tools → Modeling Spatial Relationships → Generated Spatial Weights Matrix来创建.swm 文件。也可使用Geoda 软件创建.GWT 文件以使用。
3) 实例应用
Q2: 以美国俄亥俄州88个县1999年的人口为例,说明人口的聚集度。其中,权重矩阵采取反距离算法,各点的距离计算采取欧几里得距离方法,矩阵的标准化选择无,其他值默认(如图1-6所示)。
图1-6 实例应用之参数设置-Getis-Ord General G
3全局空间自相关统计量(Spatial Autocorrelation)
1) 基本原理
测量基于要素位置和属性值的空间自相关,即研究空间中,某个空间单元与其周围的单元之间,就某种特征,通过统计方法,进行空间相关性程度的计算,以分析这些空间单元在空间上分布现象的特性。也就是说,空间自相关研究的是不同观察对象的同一属性在空间上的相互关系。其计算式如下:
n ∑∑W ij S ij
I =i =1j =1
n n n δ2∑∑W ij
i =1i =1n (式1-18)
其中,S ij =(x i -x )(x j -x ) 为协方差,即相邻区域单元的值与整体均值之差的叉积。表示空间对象之间属性的相似性。x i 表示空间对象(点或面)的属性取值,x j 表示另一空间对象(点或面)的属性取值。总体方差:
δ2=∑(x i =1n i -x ) 2 (式1-19) n
I 的取值范围在-1~1之间,I<0时,代表负相关;i>0时,代表正相关,I=0时,表示无相关。I=-1(或1)时,表示有很强的负(或正)相关性。
相应的检验公式为:
Z (I ) =
其中,E (I ) =-I -E (I ) (式1-20) S E (I )
(式1-21)
检验公式中的Z 即为检验统计量,当Z>0时,代表空间对象呈聚集模式;Z=0时,呈独立随机模式;Z<>
2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools →Analyzing Patterns→ Spatial
Autocorrelation (Moran’s I)即可弹出Spatial Autocorrelation(Moran’s I)对话框,如图1-7所示。
1为期望值,即不存在空间自相关性的系数值。 n -12N 2∑ij w ij +3(∑ij w ij ) 2-N ∑i (∑j w ij ) 2S E (I ) =SQRT [](N 2-1)(ij w ij ) 2
图1-7 Spatial Autocorrelation(Moran’s I)对话框
A.
B.
C.
D.
E. Input Feature Class:输入要素类; Input Field:用于测量聚集度的字段; Display Output Graphically可选框,设定为TRUE 时,则以图形方式显示局部G 和Z 值; Conceptualization of Spatial Relationships:要素间的关联方式; Distance Method :指定计算距离的方法,Euclidean Distance 欧几里得距离,Manhattan
Distance 曼哈顿距离;
F. Standardization :权重标准化的方式,以提供更精确的结果,None 表示无标准化,Row
表示行标准化空间权重;
G. Distance Band or Threshold Distance:指定距离阈值,超过阈值的要素会被忽略。当关联
方式选择反距离和二值法时,需要在此设定距离。当此参数留空,默认阈值将被计算和应用。当设置为“邻接多边形”或“从文件获取空间权重”时,该参数不会影响计算。 H. Weights Matrix File(optional ):空间权重矩阵文件。
实例应用Q3:美国俄亥俄州88个县居民收入为例,要素间的关联方式采取平方反距离方法,而各县之间的距离采用欧几里得距离方法且权重矩阵无标准化,其他参数默认,观察得到居民收入的空间自相关性程度。
3)
图1-8 应用实例之设置参数-M oran’s I
4. 不同空间尺度的空间聚类分析(Multi-Distance Spatial Cluster Analysis)
K-function (K 函数)分析法由Riple y’s K于1976提出,用来分析不同空间尺度上的聚集程度是否一致。
1) 基本原理
Ripley’s K统计量是多阶邻点统计量的扩展,可以利用它来分析某一点分布在不同空间
尺度上所表现出的特定模式。对于一个区域中的一组点,K 函数分析法的步骤如下:
a) 设定一个距离增量或者说空间步长(spatial lag )d ,将其作为反映空间尺度变化的单
位。如果区域内相隔最远的两个点相距D 个单位,那么显然d
b) 在开始时将迭代次数g 设定为1. ;
c) 以h 为半径在区域中每个点i 的周围创建一个圆形缓冲区,这里h =d ?g 。因此,第
一次迭代中缓冲区的半径为d ,第一次为2d ,依此类推;
d) 对于每个点,计算落在其半径为h 的缓冲区内的点的个数n (h ) ;
e) 将缓冲区的半径增大一个d (即在第二次迭代中,缓冲区的半径将为)d ?2或者说
2d ;
f) h 值每增大一个d ,便重复步骤c 、d 、e ,直到g =r 或g =D /d 。
对于上述迭代过程,如果点集呈高度聚集模式,则较小的h 值对应着较大的点数,并且当h 增大到一个相对较大的水平时,点数的增长便会放缓。相反,如果点模式较为分散,那么当h 较小时,点数也会较小,而当h 增大时,点数会快速增长。步长为h 的缓冲区内点的个数n (h ) 表示为:
n (h ) =∑∑I h (d ij ), i ≠j (式1-22)
i h
其中,i 和j 表示具体的点;d ij 为点i 与点j 之间的距离;I h 为指示函数,如果d ij
K (h ) =A
N 2∑∑i j I h (d ij ) w i (式1-23)
N 2
其中A 为研究区域的面积,为研究区域内点的总体分布密度,w i 表示以i 点为中A
心并且落在研究区域之内的那一部分缓冲区在整个完整的缓冲区中所占的比例。
对于随机点模式,K (h ) 函数理想的理论估计值为πh ;对于分散或规则模式来说,2
K (h ) 函数的值应小于πh 2,而对于聚集模式,则应大于πh 2。计算K (h ) 函数的值与随机点模式下的理论值之间的差值L (h ) :
L (h ) =K (h )
π-h (式1-24)
并对此差值进行绘图,较高的值(正值)表明所考察的点模式在相应的空间步长h 上呈聚集趋势,而较低的值(负值)则表明在这一步长上呈分散趋势。为了不漏掉聚集程度的细
微变化,可以选择非常小的步长,以捕获极小的尺度上分布模式的变化,但这就需要占用大量的计算资源,同时也会使K 函数受到大量随机噪音的干扰,难以反映整体趋势。
K 函数除了位置以外,不考虑其他信息,当需要同时考虑空间信息和属性信息时,K 函数分析法便不再适用。 2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools →Analyzing Patterns →Multi-Distance Spatial Cluster Analysis(Ripley’s K Function)即可弹出Multi-Distance Spatial Cluster Analysis(Ripley’s K Function)对话框,如图1-9所示。 A. B. C. D.
Input Feature Class:输入要素类; Output Table:分析结果将写入该表;
Number of Distance Bands:迭代次数g ,缓冲区距离增量的次数; Compute Confidence Envelope (optional ):置信水平。0 Permutations - no confidence envelope 表示不考虑;9 Permutations 表示90%,99 Permutations 表示99%,999 Permutations 表示99.9%;
Display Output Graphically可选框,设定为TRUE 时,则以图形方式显示期望K 值与实际K 值;
Weighted Field(optional ):一个带着权重的数值字段,表征每个点发生的事件或者要素的个数,如果该项未指定,则表示计算时按照点的位置来进行; Beginning Distance(optional ):最开始从哪个距离进行聚集分析、增加距离,此处所填数字的单位需与输出的坐标系一致; Distance Increment(optional ):每一次迭代的距离增量,此处所填数字的单位需与输出的坐标系一致;
E. F. G. H.
图1-9 Multi-Distance Spatial Cluster Analysis(Ripley’s K Function)对话框
I. Boundary Correction Method(optional ):修正计算边缘点研究范围内的邻近点数目的方
法。
? None :不用任何的修正方法。即使有点超出研究范围,这些点也会被算作研究对
象的邻近点而统计在内。
? Simulate Outer Boundary Values :模拟外边界值。该方法模拟研究范围内的点,所
以边缘附近点的统计数目没有估计根据,这些模拟点是以研究区域的边界为镜子,内部点为实物而对应出的点。
? Reduce Analysis Area:缩减分析区域。该方法缩短了研究区域所以会发现一些点在
研究区域外。这些被发现在区域外的点不是用来计算邻近点数目的而是用来分析聚集模式的。
? Ripley's Edge Correction Formula:Ripley 的边缘校正公式。这个方法用来检验研究
区域的边缘与点j (点i 邻近区域内的所有点),哪个和i 更近,如果j 更近,则权重赋给点j 。此边缘修正方法只适合于方形或者长方形状的研究范围。
J. Study Area Method(optional ):对研究区域指定一个范围。因为K 函数对尺度变化比较
敏感,所以此处选择非常重要。
? Minimum Enclosing Rectangle:最小的封闭矩形。可以包含研究区域内所有点的最
小的矩形。
? User provided Study Area Feature Class:用户提供的研究区域要素类。研究区域要
素类的界限提供了所研究的区域。
K. Study Area Feature Class(optional ):指定研究范围的要素类。此处输入的要素类描述该
分析功能的分析范围。只有当Study Area Method(optional )总选择User provided Study Area Feature Class时才设置此项。 3) 实例应用
Q4:以我国3407个县的分布为例,设定起始距离为1000米,每次增加量为100000米,迭代次数为10,采用Ripley 边缘修正方法,研究区域为最小的封闭矩形(如图1-10)。
图1-10 实例应用之参数设置-Ripley’s K Function
聚类分布制图
确定统计量上重要的最受关注地区(hot spots ),不受关注地区(cold spots )以及一些有特例的地区。
1. 聚集和异常值分析工具(Cluster and Outlier Analysis) 1) 基本原理
根据权重数据点集,对大量相似点和异质点进行聚类,即计算Anselin Local Moran’s I 指数,以衡量全局和局部的空间关联和空间作用。计算公式如下:
对于第i 个区域单元,Moran ’s I LISA 定义为
(x -x ) I i =i 2
S
2
j , j =i
∑w
n
ij
(x j -x ) (式2-1)
1n 1n 2
3) S =∑(x i -x ) , x =∑x i (式2-2,
n i =1n i =1
且i ≠j ,在完全随机的假定下,I i 的理论平均值为E (I i ) =-W i /n -1,各区域单元的Z 值按下面的方法计算:
z [I i ]=
I i -E [I i ][I i ]
(式2-4)
?[n -][2-n ]?2222 w ij ?2(∑z i ) (∑z i ) ∑ ???j ??i i
?Var [I i ]= w +w w - ∑∑ik ih 2 ∑ij ?(n -1) (n -1)(n -2) (n -1) k ≠i h ≠i ?j ?
i
i
∑z i
4
∑z i
4
2
(式2-5)
使用该工具会输出一个新的要素类,该要素类在原要素类上添加了三个字段,分别为LMi 、LMz 和LMp ,分别代表各个要素的局部自相关统计量I 、z score值以及p 值。如果I 为正,则要素值与其相邻的要素值相近,如果I 值为负值,则与相邻要素值有很大的不同。如果z score为正且越大,则要素越与相邻要素值相近,相反,如果z score值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。 2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools →Mapping Clusters →Cluster and Outlier Analysis (Anselin Local Moran’s I)即可弹出Cluster and Outlier Analysis(Anselin Local Moran’s I )对话框,如图2-1所示。 A. B. C. D.
Input Feature Class:输入要素类; Input Field:用于测量聚集度的字段;
Output Features Class:输出文件的路径和名称;
Conceptualization of Spatial Relationships:要素间的关联方式
图2-1 Cluster and Outlier Analysis(Anselin Local Moran’s I)对话框
E. Distance Method :指定计算距离的方法,Euclidean Distance 欧几里得距离,Manhattan
Distance 曼哈顿距离;
F. Standardization :权重标准化的方式,以提供更精确的结果,None 表示无标准化,Row
表示行标准化空间权重;
G. Distance Band or Threshold Distance:指定距离阈值,超过阈值的要素在聚类分析中会被
忽略。当关联方式选择反距离和二值法时,需要在此设定距离。当此参数留空,默认阈值将被计算和应用。当设置为“邻接多边形”或“从文件获取空间权重”时,该参数不会影响计算。
H. Weights Matrix File(optional ):空间权重矩阵文件。 3) 实例应用
Q5:以美国俄亥俄州88个县的居民收入为数据,权重计算采取邻接多边形(一阶)的方法,其他值默认(图2-2),得到俄亥俄州各县居民收入局部空间自相关图。
图2-2 实例应用之参数设置- Cluster and Outlier Analysis(Anselin Local Moran’s I)
2. 热点分析(Hot Spot Analysis)
它与广义G 统计量的局部形式差别很小,在计算G i 时,i 单元不能等于j 单元,但在计算G i 时则可以。该统计量表征对输入要素进行Getis-Ord Gi*统计,从而分析空间的异质性、集聚度和孤立特征等。并把统计结果作为新加字段GiZscore 和GiPvalue 写入输出要素中。 1) 基本原理
*
G i *分别针对各区域单元计算,旨在表明所关注区域单元的值与其周边以距离d 定义的
相邻单元的值之间的关联性。其计算公式为:
G i *=
∑w
j
ij
(d ) x j
(式2-6)
x j
j
x i ,x j 是单元i 与j 的属性,w ij (d ) 是通过距离函数或者说距离标准为d 的邻接函数
来确定的权重,如果区域单元i 与j 之间的距离小于d ,权重w ij (d ) 就等于1,否则就等于0。期望值为:
E (G i *) =W i /(n -1) (式2-7)
W i =∑w ij (d ) (式2-8)
j
方差计算公式为:
?W i (n -1-W i ) ∑x j 2?
??W i (W i -1) 1j *
(式2-9) Var (G i ) =??+
(n -1)(n -2) (n -1)(n -2) (x j ) 2??
j
??
则标准化Z (G i ) 值计算公式为:
*
Z (G ) =
表2-1
*
i
G i *-E (G i *) (G )
*i
(式2-10)
G i *
统计量标准化Z 值的含义
2) 参数设置
在ArcToolbox 中点击Spatial Statistics Tools →Mapping Clusters →Hot Spot Analysis (Getis-Ord Gi*),即可弹出Hot Spot Analysis (Getis-Ord Gi*)对话框,如图2-3所示。 A. B. C. D.
Input Feature Class:输入要素类; Input Field:用于测量聚集度的字段;
Output Features Class:输出文件的路径和名称;
Conceptualization of Spatial Relationships:要素间的关联方式
图2-3 Hot Spot Analysis(Getis-Ord Gi*)对话框
E. Distance Method :指定计算距离的方法,Euclidean Distance 欧几里得距离,Manhattan
Distance 曼哈顿距离;
F. Standardization :权重标准化的方式,以提供更精确的结果,None 表示无标准化,Row
表示行标准化空间权重;
G. Distance Band or Threshold Distance:指定距离阈值,超过阈值的要素在聚类分析中会被
忽略。当关联方式选择反距离和二值法时,需要在此设定距离。当此参数留空,默认阈值将被计算和应用。当设置为“邻接多边形”或“从文件获取空间权重”时,该参数不会影响计算; H. Self Potential Field(optional ):自相关字段(用户自定义字段),因计算I.
表明单元i 与单元i 之间的距离或者权重;
Weights Matrix File(optional ):空间权重矩阵文件。
G i *
时,允许i=j,
3) 实例应用
Q6:以美国俄亥俄州88个县居民收入为例,权重采取反距离算法,各单元之间的距离采取欧几里得距离方法,其他默认(图2-4);得到居民收入的局部空间自相关性程度图。
图2-4应用实例之参数设置-Getis-Ord Gi*
五、实验探索
探索Spatial Statistics工具集中的Measuring Geographic Distributions工具和Utilities 工具。 要求:
1、写出每个工具对应子工具的主要功能描述(包括具体的每个参数的说明)——可参考帮 助文件等; 2、 每个工具集中至少选取两个子工具进行实验操作,要有利用数据进行功能实验的截图(数 据自己创建或者以其它方式获取)。
六、实验提交
1、解答6个实验问题(实验讲解过程中提出来的)
要求:提交实验过程中具体参数设置及输出结果的截图,并对结果进行简要的文字说明。 2、完成实验探索的内容
要求:(1)写出每个工具对应子工具的主要功能描述(包括具体的每个参数的说明)——可参考帮助文件等;(2)每个工具集中至少选取两个子工具进行实验操作,要有利用数据进行功能实验的截图(数据自己创建或者以其它方式获取)。
实验报告中应包括实验名称、实验目的、实验原理、实验详细步骤(说明+截图)、实验提交成果、心得与疑问。实验报告必须在下一周周二下午5点之前提交,否则扣分;实验报告要完整与规范;疑问汇总后将会在下一次实验课上进行讲解。
实验报告提交地址: /空间分析实验报告提交 实验疑问解答下载地址 :ftp://ciee.cau.edu.cn /空间分析实验疑问解答 用户名:dixin081 密码:dixin081
作业提交命名方式:“学号_姓名_实验名称”(例如:0908140101_小红_实验一)
转载请注明出处范文大全网 » 空间统计分析实习报告
0时,代表负相关;i>