1、ß ArcGIS中的空间参考系统 ß 数据转换(矢量、栅格、三维数据之间的转换) ß Geodatabase建立的基本内容 ß 栅格、矢量数据的空间分析操作 ß 栅格、矢量数据的最短路径分析 ß 空间数据插值的主要方法 ß 三维分析 ß 水文分析 ß 地统计分析(半变异函数分析、kriging插值等) 1. ArcGIS中的空间参考系统 地理坐标系统——球面坐标(包括角度测量单位、本初子午线和基于椭球体的数据) Þ Spheroid 椭球体参数:长、短轴、扁心率 Þ Datum 大地基准面 Þ 预定义地理坐标系统 投影坐标系统——
2、直角平面坐标 Þ Continental(大陆)、Country Systems、Gauss Kruger、National Grids(国家网格)、Polar(两极)、State Plane(政府)、State Systems(州级)、UTM、World 我国常用的投影系统 ß 高斯—克吕格,比例尺≥1:500 000 ß 正轴等角割圆锥投影,比例尺≤1:1000 000,与国际百万分之一所采用的分幅 ß 正轴等角割圆锥投影或同一投影系统正轴等面积割圆锥投影,我国大部分省区图 ß 正轴等角割圆锥投影,地球表面上两点间最短距离(大圆航线)表现为近于直线 ß 阿尔伯斯双标
3、准多圆锥投影(正轴等角圆锥投影)ALBERS EQUAL-AREA CONIC:我国新编1:1000 000地图 ArcGIS中坐标转换 ß ArcCatalog中更改坐标系统,仅改变元数据,即显示,不改变源数据 ß ArcToolbox,ArcMap中Export更改坐标系统,真正改变数据 ArcGIS中的地图参考 ß 针对栅格图像数据:Georeferencing工具(空间参考) ß 针对矢量数据:Spatial Adjustment(空间纠正) 2.数据转换(矢量、栅格、三维数据之间的转换) ß 栅格数据向矢量数据的转换 将栅格数据分析的结果,通过矢量绘
4、图装置输出; 或者为数据压缩的需要,将大量的面状栅格数据转换为由少量数据表示的多边形边界 ß 矢量数据向栅格数据的转换 多为空间分析、数据复合的需要 (矢量数据的基本坐标是直角坐标X、Y,其坐标原点一般取图的左下角。网格数据的基本坐标是行和列(i,j),其坐标原点一般取图的左上角。两种数据变换时,令直角坐标X和Y分别与行与列平行 ) Conversion Tools à From Raster/To Raster ß 2D数据3维化 ß 设置要素的高程值数据源 ß 选择一TIN或栅格表面 ß 通过要素属性获取要素高程值 ß 以某一常量作为要素高程属性 ß 从矢量
5、创建tin ß 选择创建TIN所要使用的要素图层 ß 选择要使用的其它要素类 ß 选择高程字段 ß 选择要素合成方式,包括点集、隔断线或多边形 ß 选择标志值字段(如需要以要素的值来标记TIN要素) ß 向TIN中添加要素 ß 选择要添加到TIN中的要素图层及其它要素类 Þ 如果要素具有三维几何特征,可以选择shape字段 Þ 选择高程字段 Þ 选择要素集成到TIN中的方式,包括点集、隔断线或多边形 Þ 选择标志值字段(可选) ß 保存在原TIN中或存为新文件 ß 由栅格创建TIN ß 设定TIN的垂直精度(输入栅格单元中心的高程与TIN表面间的最大差值) ß
6、垂直精度的值越小,生成的TIN将越好地保持原有栅格表面的详尽程度 ß 垂直精度的值越大,生成的表面越粗略 ß 设定限制加入到TIN中的点数(可选) ß 由TIN创建栅格表面 ß 将TIN转换成栅格表面,或者从TIN中提取坡度、坡向等地形因子 ß 选择要转到栅格中的TIN属性,可以是高程、坡向、以度为单位的坡度和以百分数为单位的坡度 ß 设置高程转换系数 ß 设置输出栅格单元的大小(可选) 2. Geodatabase建立的基本内容 GEODATABASE组成 ß Geodatabase:地理数据的层次型组织 Þ 对象类(Object Class) :存储非空间数据的表
7、格(Table) Þ 要素类(Feature Class) :同类空间要素的集合,即具有相同几何类型和属性的要素的集合 Þ 如河流、道路、植被、用地等 Þ 要素类之间可以独立存在,也可具有某种关系 Þ 要素数据集(feature dataset):多个要素类的集合 当不同的要素类之间存在关系时,应考虑将它们组织到一个要素数据集(Feature dataset)中 ß 共享空间参考系统、具有某种关系的多个要素类的集合 Þ 覆盖同一空间范围的要素类,如全国范围内某种比例尺的水系数据,其点、线、面类型的要素类可组织为同一个要素数据集 Þ 同一几何网络中充当连接点和边的要素类,必须
8、组织到同一要素数据集中。如配电网络中的各种开关、变压器、电缆等,分别对应点或线类型的要素类,在配电网络建模时,应全部考虑到对应的几何网络模型中 Þ 共享公共几何特征的要素类,移动其中的一个要素时,其公共部分也要求一起移动,并保持这种公共关系不变。如用地、行政区界等 GEODATABASE建立 1.借助ArcCatalog,创建一个新的Geodatabase Þ 建立一个新的Geodatabase。没有可装载的数据,或已经有的数据只能部分满足数据库设计 Þ 移植已存在数据到Geodatabase。转换已有Shapefile、Coverage、INFO Table、dBASE Tabl
9、es等数据并输入到Geodatabase中 Þ 用CASE工具建立Geodatabase。用CASE工具建立新的定制对象,或从UML( Unified Modeling Language)图中产生Geodatabase模式 2.建立Geodatabase的基本组成项 Þ 包括关系表、要素类、要素数据集 (1)明确空间参考 ①坐标系统和坐标值域 ②数据集中的所有要素类用相同的坐标系统,所有要素类的所有要素坐标必须在坐标值域的范围内 ③Select、Import或New方式设置要素数据集的空间参考 (2)要素类分为简单要素类和独立要素类 ①简单要素类存放在要素数据集中,使用要
10、素数据集的坐标,不需要重新定义空间参考 ②独立要素类存放在数据库中的要素数据集之外,须定义自己的空间参考坐标系统和坐标值域 3.向Geodatabase各项加载数据 (1) New:建立新的对象 (2) Import/Export/Load:利用已经存在的Shapefiles,Coverages,INFO Tables和dBaseTables向Geodatabase加载数据 ①Import:导入Shapefile、Coverage、INFO表和dBASE表等到一个Geodatabase时,导入的数据作为新的要素类或新表存在。在导入这些数据之前,这些要素类和表是不存在的 ②Load
11、载入数据不同于导入数据。载入数据要求在Geodatabase中必须首先存在与被载入数据具有结构匹配的数据对象 (3) 导入栅格数据 ①导入Geodatabase中作为栅格数据集存储 ②导入Geodatabase中已存在的栅格数据集、 ③选择Raster Datasets(mosaic),添加想要导入及拼接的多个栅格数据,输入Geodatabase中已经存在的栅格数据集的路径,选择栅格数据的拼接方式、拼接后采用的颜色模式、指定可以设置为Nodata的值,并设置拼接容限值 (4) 把dBASE表和INFO表导入到Geodatabase中,可自动纠正不合逻辑的或重复的字段名字,可通过
12、交互方式指定如何更改字段,再进行导入 4.进一步定义Geodatabase Þ 建立索引 Þ 建立空间要素的几何网络(Geometric Networks) 、子类型(Subtypes)、属性域(Attribute Domains)、空间要素或非空间要素类之间的关系类等 4.栅格、矢量数据的空间分析操作 栅格: ß 栅格数据属性 ß 栅格分析环境 ß 栅格数据重分类 ß 距离分析 ß 表面分析 ß 栅格计算器 ß 采样点数据空间插值 ß 栅格单元统计 ß 交叉面积表 ß 分区统计 ß 邻域分析 ß 矢量: Xql: 栅格模型:地理空间被
13、划分为规则单元,空间位置由单元的行列号表示。像元大小反映数据的分辨率,空间对象由若干单元隐含描述。栅格数据模型将地理空间看成一个连续的整体,在这个空间中处处有定义。栅格结构以规则阵列表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。点用一个栅格单元表示;线状地物则用沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上;面或区域用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。任何以面状分布的对象都可以用栅格数据逼近。属性明显,定位隐含,即数据直接记录属性的指针或属性本身,而所在位置则根据行列号转换为相应的坐
14、标给出,即定位是根据数据在数据集中的位置得到的。由于栅格结构是按一定的规则排列的,所表示实体的位置很容易隐含在网格文件的存贮结构中。栅格行列阵列容易为计算机存储、操作和显示,结构容易实现,算法简单,且易于扩充、修改,也很直观,易于同遥感影像结合处理,便于地理空间数据处理。特别适合于高级语言作文件或矩阵处理。栅格结构表示的地表是不连续的,是量化和近似离散的数据。在栅格结构中,地表被分成相互邻接、规则排列的矩形方块,每个方块与一个栅格单元相对应。栅格数据的比例尺是栅格大小与地表相应单元大小之比。在许多栅格数据处理时,常假设栅格所表示的量化表面是连续的,以便使用某些连续函数。由于栅格结构对地表的量化
15、在计算面积、长度、形状等空间指标时,若栅格尺寸较大,则会造成较大的误差。在一个栅格的地表范围内,可能存在多于一种的地物,而表示在相应的栅格结构中常只能是一个代码。误差不仅有形态上的畸变,还可能包括属性方面的偏差。 矢量模型:将地理空间看成一个空间区域,地理要素存在于其间。矢量模型中,各类地理要素根据其空间形态特征分为点、线、面三类,对实体实施位置显式、属性隐式的描述。点实体包括由单独一对(x,y)坐标定位的一切地理或制图实体。除(x,y)坐标外还存储其它一些与点实体有关的数据来描述点实体的类型、制图符号和显示要求等。点是空间上不可再分的地理实体,具体的或抽象的,如地物点、文本位置点或线段网
16、络的结点等。如果点是一个与其它信息无关的符号,则记录时应包括符号类型、大小、方向等有关信息。如果点是文本实体,记录的数据应包括字符大小、字体、排列方式、比例、方向以及与其它非图形属性的联系方式等信息。线实体用其中心轴线(或侧边线)上的抽样点坐标串表示其位置和形状。线实体可以定义为直线元素组成的各种线性要素,直线元素由两对以上(x,y)坐标定义。最简单的线实体只存储起止点坐标、属性、显示符等有关数据。面实体用范围轮廓线上的抽样点坐标串表示位置和范围,多边形(面、区域)数据是描述地理空间信息的最重要的一类数据。在区域实体中,具有名称属性和分类属性的,多用多边形表示,如行政区、土地类型、植被分布等;
17、具有标量属性的有时也用等值线描 区别:栅格数据用元子空间充填集合表示,栅格数据面向空间的数据结构在布尔运算、整体操作特征计算及空间检索方面有明显的优势。矢量数据用点串序列表达边界形状及分布,矢量数据面向目标的数据结构很容易实现模型生成、目标显示及几何变换。 ⑴ 栅格 分析模式:常使用线性代数的二维数字矩阵分析法作为数据分析的数学基础,具有分析处理简单、分析处理模式化强的特征。栅格数据的分析处理方法可以概括为聚类聚合分析、多层面复合分析、追踪分析、窗口分析、统计分析、量算等几种基本的分析模式。 聚类、聚合分析:指将一个单一层面的栅格数据系统经某种变换而得到一个具有新含义的栅格数据系统的数
18、据处理过程。也称之为栅格数据的单层面派生处理法。栅格数据的聚类是根据设定的聚类条件对原有数据进行有选择的信息提取,建立新的栅格数据的方法。栅格数据的聚合分析是指根据空间分辨率和分类表,进行数据类型的合并或转换以实现空间地域的兼并。 多层面复合分析:便利地进行同地区多层面空间信息的自动复合叠置分析,是栅格数据一个突出的优点。栅格数据常被用来进行区域适应性评价、资源开发利用、规划等多因素分析研究工作。在数字遥感图象处理工作中,利用该方法可以实现不同波段遥感信息的自动合成处理;还可以利用不同时间的数据信息进行某类现象动态变化的分析和预测。 追踪分析:对于特定的栅格数据系统,由某一个或多个起点,按
19、照一定的追踪线索追踪目标或者追踪轨迹信息提取的空间分析方法。例如:栅格记录地面点的海拔高程值,根据地面水流必然向最大坡度方向流动的基本追踪线索,可以得出在多个点位地面水流的基本轨迹。追踪分析法在扫描图件的矢量化、利用数字高程模型自动提取等高线、污染源的追踪分析等方面都发挥着十分重要的作用。 窗口分析:是指对于栅格数据系统中的一个、多个栅格或全部数据,开辟一个有固定分析半径的分析窗口,并在该窗口内进行诸如极值、均值等一系列统计计算,或与其它层面的信息进行必要的复合分析,从而实现栅格数据有效的水平方向扩展分析。 统计与量算:需要了解一组栅格数据的整体特征和态势时,通常对其进行统计分析。统计分析
20、的目的是为了解数据分布的趋势或者通过趋势的了解回归拟合出某些空间属性之间的关系,以把握空间属性之间的关系和规律。栅格数据常规的统计分析主要指对数据集合的最大值、最小值、均值、中值、总和、方差、频数、众数、范围等参数进行分析。 ①设置分析环境 分析选项:工作目录、掩模、空间参考系统、分析范围、分析栅格大小;经设定将保持到下一次修改。空间分析选项设置决定经空间分析得到的栅格数据的空间属性。其中:分析范围是分析派生的数据的空间属性,是矩形区域;分析栅格的尺寸决定输出栅格的尺寸,要进行多个栅格数据集间的分析时使用一致的栅格大小;分析掩模定义了分析栅格的范围,定义了输出栅格的形状。 ②密度制图:反
21、映点或线要素的聚集状况。根据输入的要素数据集计算整个区域的数据聚集状况,从而产生一个连续的密度表面。主要基于点数据生成,以每个待计算格网点为中心,进行环形区域的搜寻,进而来计算每个格网点的密度值。通过离散采样点进行表面内插的过程。分为核函数密度制图(Kernal)和简单密度制图(Simple)。在核函数密度制图中,落入搜索区内的点具有不同的权重,靠近格网搜寻区域中心的点或线会被赋以较大的权重,随着其与格网中心距离的加大,权重降低。计算结果分布较平滑。在简单密度制图中,落在搜寻区域内的点或线有同样的权重,先对其进行求和,再除以搜索区域的大小,从而得到每个点的密度值。 ③表面分析(ArcTool
22、Box中的Surface工具):主要类型有,创建等值线Contour,计算坡度Slope,计算坡向Aspect,计算山体阴影HillShade,填挖Cut/Fill。 创建等值线:等值线是将表面上相邻的具有相同值的点连接起来的线,等值线分布的疏密一定程度上表明了表面值的变化情况。等值线密集,表面值的变化剧烈;等值线稀疏,表面值的变化细微。通过研究等值线,可以找到等值点的位置,获得表面值变化的基本趋势。主要因素有,基地等值线、z方向系数、等值距。 坡度:地表任一点的坡度(Slope)是指过该点的切平面与水平地面的夹角,表示地表在该点的倾斜程度。坡度与坡向可在DEM或TIN数据的基础上提取。A
23、rcGIS中坡度与坡向的计算通常在3×3的栅格窗口中进行,表达任一单元和近邻单元间变化的最大比率。 坡向:坡向定义为坡面法线在水平面上的投影与正北方向的夹角。坡向表征了高程值改变量的最大变化方向,可在数字高程模型DEM或TIN数据的基础上提取。在ArcGIS中Aspect表示每个栅格与它相邻的栅格之间沿坡面向下最陡的方向。 山体阴影:模拟地面的光照情况,产生地形表面的阴影图。根据假想的照明光源对高程栅格图的每个栅格单元计算亮度值。通过设置假象光源位置,计算每个单元以及相关邻域单元的光照值。表达地形的立体形态,提取地形遮蔽信息。三个主要参数,太阳方位角、太阳高度角、表面灰度值。 视域分析:
24、视域分析属于根据地形进行最优化处理的范畴。识别输入数据中能看到一/多个观测点的单元。在输出数据中,每个单元的特征值表明从该点能看到多少个观测点。也就是说表示了对于一个可视位置,有多少观察点可以看到此位置。 填挖分析:通过比较两个表面模型前后的变化计算出变换的面积/体积,可用于确定增加/减少表面物质引起的面积/体积变化。计算填埋及挖掘土石方量。河谷中发生侵蚀/沉积的位置和量。 ④统计分析 ⑤栅格计算:使用栅格计算器工具,栅格查询、图层叠加分析。其中栅格叠加的分析原理为,栅格数据基于相同坐标系统,基于栅格单元(像元)进行;多个栅格图层中具有相同的X,Y的像元进行运算输出结果为单一栅格图层,复
25、合了参与运算的各栅格图层的信息。 ⑥重分类:将栅格图层的数值进行重新分类组织或解释,关键是确定原数据到新数据之间的对应关系。 ⑵矢量 分析方法:与栅格数据分析处理方法相比,矢量数据一般不存在模式化的分析处理方法,而表现为处理方法的多样性与复杂性。 包含分析:确定要素之间是否存在直接的联系,即矢量点、线、面之间是否存在空间位置上的联系,这是在地理信息系统中实现图形、属性对位检索的前提条件与基本的分析方法。 ①缓冲区分析 ②叠置分析 5.栅格、矢量数据的最短路径分析 栅格: 1.最短路径函数:获取从一个或一组源出发,到达一个或一组目标地的最短直线路径或最小成本路径。 2.最短路
26、径的找寻 获取成本数据 执行成本加权距离函数,获取成本方向数据和成本累计数据 执行最短路径功能获取最短或最优路径 3. 最短路径的计算中,源可以是点要素,也可以是区域要素 Þ For Each Cell:为源中每一个单元点寻找一条成本最小路径 Þ For Each Zone:为每个源寻找一条成本最小路径,源中所有单元共享同一条路径 Þ For Each ZoneBest Single:为所有源找寻一条成本最小路径,此时,只有一个源与一个相应的目标点或目标组相连 矢量: 6.空间数据插值的主要方法 1.IDW方法是根据距离衰减规律,对样本点的空间距离进行加权,当权重等于
27、1时,是线性距离衰减插值,当权重大于1时,是非线性距离衰减插值。 缺点是如果不了解研究区域的地价结构分布特征,不合理的加权会导致较大的偏差。 IDW是一个加权距离平均,其每一栅格的输出值限制在采样点的输入值的范围内,因此,对如山脊和沟谷这样的极端地形,如果没有采样点,IDW不会生成这些地形。当取样点足够密时,IDW对局部变化具有非常好的效果 2.Spline样条函数是用一种数学函数来估计值,最小化所有的表面曲率,逼近曲面一种方法。 易操作,计算量不大,不需要对空间方差的结构做预先估计;不需要做统计假设,而这些假设往往是难以估计和验证的;同时,当表面很平滑时,也不牺牲精度。 适合于非常
28、平滑的表面,一般要求有连续的一阶和二阶导数;它适合于根据很密的点内插等值线,特别是从不规则三角网(TIN)内插等值线。 缺点是难以对误差进行估计,点稀时效果不好。 Spline是基于生成具有连续的二阶导数和最小的平方曲率的插值方法,所以它适合那些空间连续变化并且光滑的表面的生成。 7.三维分析 8.水文分析 9. 地统计分析(半变异函数分析、kriging插值等) 定义:以区域化变量理论为基础,以变异函数为主要工具,研究在空间分布上既有随机性又有结构性,或具有空间相关和依赖性的现象。 以区域化变量理论为基础的地统计学的两个最基本的函数:协方差函数、变异函数。
29、半变异函数 1.半变异函数(半变差函数、半变异矩),是地统计分析的特有函数。区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半称为区域化变量Z(x)的半变异函数,记为r(h),2r(h)称为变异函数。 (5) 区域化变量Z(x)满足二阶平稳假设 (6) 半变异函数依赖于自变量x和h,当半变异函数r(x,h)仅仅依赖于距离h而与位置x无关时,r(x,h)可改写为r(h) (7) 半变异函数和协方差函数把统计相关系数的大小作为距离的函数,是地理学相近相似定理的定量化。 (1)协方差函数和半变异函数随着距离的加
30、大基本呈反向变化特征,半变异值的变化随着距离的加大而增加,协方差随着距离的加大而减小。 (2)即,当两事物彼此距离较小时,协方差值较大,而半变异值较小;反之,协方差值较小,而半变异值较大。 (3)半变异函数曲线图和协方差函数曲线反映了一个采样点与其相邻采样点的空间关系。 (4)对异常采样点具有很好的探测作用,在ArcGIS地统计分析模块中一般采用半变异数。 (5)半变异曲线图中的重要点和参数 间隔为0时的点 半变异函数趋近平稳时的拐点 由这两个点产生四个相应的参数 ①块金值(Nugget)或称区域不连续性值(localized disconti
31、nuity) 块金值表示区域化变量在小于抽样尺度时的非连续变异,由区域化变量的属性或测量误差决定。理论上,当采样点间的距离为0时,半变异函数值应为0;但由于存在测量误差和空间变异,两采样点非常接近时,它们的半变异函数值不为0,即存在块金值或块金方差(nugget variance)。 ②变程(Range)或称空间依赖范围(range of spatial dependence) 当半变异函数的取值由初始的块金值达到基台值时,采样点的间隔距离称为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度的限定。 在变程R范围内,样点间的距离越小,其相似性,即空
32、间相关性越大。当h>R时,区域化变量Z(x)的空间相关性不存在,即当某点与已知点的距离大于变程时,该点数据不能用于内插或外推。 ③基台值(Sill)和偏基台值(Partial Sill) 基台值:采样点间距离h增大时,半变异函数r(h)从初始的块金值达到一个相对稳定的常数,该常数值称为基台值。基台值是系统或系统属性中最大的变异,当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不再存在。 偏基台值:基台值与块金值的差值。 克里格插值 1.克里格插值(Kriging)为空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量
33、进行无偏最优估计的一种方法,是地统计学的主要内容之一。 2.克里格方法的适用范围为区域化变量存在空间相关性。 利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏、最优估计。 克里格方法是根据未知样点有限邻域内的若干已知样本点数据,在考虑了样本点的形状、大小和空间方位,与未知样点的相互空间位置关系,以及变异函数提供的结构信息之后,对未知样点进行的一种线性无偏最优估计 3.普通克里格(Ordinary Kriging)是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量的期望值是未知的。插值过程类似于加权滑动平均,权重值的确定来自于空间数据分析。 4.泛克里格插值: 假设数据中存在主导趋势,且该趋势可以用一个确定的函数或多项式来拟合。 (1)分析数据中存在的变化趋势,获得拟合模型。 (2)对残差数据(即原始数据—趋势数据)进行克里格分析。 (3)将趋势面分析和残差分析的克里格结果加和,得到最终结果。






