资源描述
第一节 地理空间及其表达
1.地理空间定义
不同学科对“空间”(Space)概念的解释:
物理学,空间是指宇宙在三个相互垂直方向上所具有的广延性;天文学,空间是指时/空连续体的一部分;
地理学,地理空间(Geographic space)是指物质、能量、信息的存在形式在空间形态、结构过程、功能关系上的分布、格局及其在时间上的延续。
地理信息系统中的“地理空间”,一般包括地理空间定位框架及其所关联的空间对象。
2.地理空间定位框架即大地测量控制,由平面控制网和高程控制网组成
GIS的任何空间数据都必须纳入一个统一的空间参照系中,以实现不同来源数据的融合、连接与统一;
2.1定位坐标系:平面控制网
直接建立在球体上的地理坐标,用经度和纬度表达地理对象位置
投影:建立在平面上的直角坐标系统,用(x,y)表达地理对象位置
不同地理空间模型之间的关系
固体地球表面、大地水准面和椭球体模型之间的关系
2.2定位坐标系:高程控制网
3.地图投影
定义:将地球椭球面上的点映射到平面上的 方法,称为地图投影
(1)投影—为什么要进行投影
将地球椭球面上的点映射到平面上的方法,称为地图投影
地理坐标为球面坐标,不方便进行距离、方位、面积等参数的量算
地球椭球体为不可展曲面
地图为平面,符合视觉心理,并易于进行距离、方位、面积等量算和各种空间分析
(2)投影实质
建立地球椭球面上经纬线网和平面上相应经纬线网的数学基础,也就是建立地球椭球面上的点的地理坐标(λ,φ)与平面上对应点的平面坐标(x,y)之间的函数关系: 当给定不同的具体条件时,将得到不同类型的投影方式
(3)投影变形
将不可展的地球椭球面展开成平面,并且不能有断裂,则图形必将在某些地方被拉伸,某些地方被压缩,故投影变形是不可避免的。长度变形、面积变形、角度变形
(4)投影方法
(5)投影分类
(6)投影影响因素
制图区域的地理位置、形状和范围
制图比例尺
地图内容
出版方式
(7)GIS中的地图投影
GIS以地图方式显示地理信息。地图是平面,而地理信息则是在地球椭球上,因此地图投影在GIS中不可缺少;
GIS数据库中地理数据以地理坐标存储时,则以地图为数据源的空间数据必须通过投影变换转换成地理坐标;而输出或显示时,则要将地理坐标表示的空间数据通过投影变换变换成指定投影的平面坐标;
GIS中,地理数据的显示可根据用户的需要而指定投影方式,但当所显示的地图与国家基本地图系列的比例尺一致时,一般采用国家基本系列地图所用的投影;
(8)我国常用的地图投影
小比例尺的中国行政区划图:兰勃投影(正轴等积割圆锥投影)
大部分分省图、大多数同级比例尺也采用兰勃投影1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000采用高斯—克吕格投影。
世界政区图:等差分纬线多圆锥投影;正切差分纬线多圆锥投影
世界交通图、时区图:墨卡托投影(等角正轴圆柱投影)
二 空间实体的表达
1、矢量表示法:如果采用一个没有大小的点(坐标)来表示点元素时,就称为矢量表示法。
2、栅格表示法:如果采用一个有固定大小的点(面元)来表达基本点元素时,就称为栅格表示法。
空间实体表达:矢量表示法
点:位置:(x,y)、属性:符号
线:位置: (x1,y1),(x2,y2),…,(xn,yn)
属性:符号—形状、颜色、尺寸
面:位置(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn),(x1,y1)
属性:符号变化, 等值线
空间实体表达:栅格表示法
第二节 地理空间数据及其特征
一、GIS的空间数据的分类
1、按数据来源
(1)地图数据 普通地图和专题地图
(2)影像数据 卫星遥感和航空遥感数据
(3)文本数据 来源于各类调查报告,实测数据,文献资料,解译信息等.
2、按数据结构分类
(1)矢量数据结构:是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式。
(2)栅格数据结构:基于栅格模型的数据结构,即指将空间分割成有规则的网格,在各个网格上给出相应的属性值来表示地理实体的一种数据组织形式。
3、按数据特征分类
(1)空间定位数据 表达空间实体在地球上位置的坐标数据.
(2)非空间数据 是关于空间实体自身的名称,种类,质量,数量等特征的数据.
4、按数据的几何特征分类
(1)点:对0维的空间实体的抽象数据。
(2)线:对1维线性的空间实体的抽象数据。
(3)面:对2维平面的空间实体的抽象数据。
(4)曲面:对在面上连续分布的空间实体的抽象数据,通常称2.5维数据。
(5)体:对3维的空间实体的抽象数据。
5、按数据的发布形式(4D数据)
(1)数字线画图(DLG)数据:对现有地形要素的矢量数据,保存个要素间的空间关系和相关的属性信息,全面地描述地表目标.
(2)数字栅格图(DRG)数据:现有纸质地图经计算机处理后得到的栅格数据文件.
(3)数字高程模型(DEM)数据:以数字形式表达的地形起伏数据.
(4)数字正射影像(DOM)数据:对遥感数字影像,经逐像元进行投影差改正,镶嵌,按国家基本比例尺地形图图幅范围剪裁生成的数字正射投影影像数据.
GIS的空间数据类型:点、线、面、体
时间:通常以第四维表达,但目前GIS还很难处理时间属性。
空间对象的维数与比例尺是相关的
二 空间数据的基本特征
三 空间数据的拓扑关系
拓扑包含的分类
1、简单包含 ID=P1 IW=1 IP=0 ID=P2 IW=0 IP¹0
2、多层包含 ID=P1 IW=1 IP=0 ID=P2 IW=1 IP¹0
3、等价包含 ID=P1 IW=3 IP=0 ID=P2 IW=0 IP¹0
ID代表当前多边形;IW表示等价包含;IP表示ID为岛(IP ¹ 0)或非岛(IP = 0) ;
(3)构建拓扑关系的意义
A根据拓扑关系,不需要利用坐标或距离,可以确定地理实体相对于另一种地理实体的空间位置关系。
B利用拓扑数据有利于空间要素的查询。
C可以利用拓扑数据作为工具,重建地理实体。
D保证数字化原始数据的自动查错编辑。
四、空间数据的计算机表示
ARC/INFO 矢量数据模型的系统
1、将空间数据抽象为不同的专题或层
(每个专题层包含指定区域内地理要素的位置数据和属性数据)
2、将一个专题层的地理要素或实体分解为点、线或面状目标。(地理实体相邻两个结点间的一个弧段是基本的存储目标,每个目标的数据包括由定位数据、属性数据和拓扑结构组成)
3、空间数据表示方法:
(1)空间分幅:将整个地理空间划分为许多子空间,再选择要表达的子空间。
(2)属性分层:将要表达的空间数据抽象成不同类型属性的数据层来表示。
(3)时间分段:将有时间特征的地理数据按其变化规律划分为不同的时间段数据,再逐一表示。
4、空间数据表示
类型:具有相同的分类码的同类目标组成类型
图层:一类或相近的若干类构成数据层;
图幅:若干数据层构成图幅;
数据库:全部数据组成数据库。
目标的数字表示:
A每个弧段或目标分配一个用户标识码(USE-ID))
B弧段的位置和形状由一系列x,y坐标定义
C弧段的拓扑关系由始结点、终结点、左多边形和右多边形数据项组成
D弧段的属性数据存储在相应的属性表中
E每个弧段的空间特征和属性特征通过用户标识码进行联结。
第三节 空间数据结构的类型
1、数据结构:是适合于计算机存储、管理、处理的数据逻辑表达。(指数据以什么形式在计算机中存储和管理)
(矢量数据结构,栅格数据结构)
2、矢量数据:是面向地物的结构,即对于每一个具体的目标都会直接赋有位置和属性信息以及目标之间的拓扑关系说明。
3、栅格数据:面向位置的结构,平面空间上的任何一点都直接联系到某一个或某一类地物。
4、矢-栅一体化结构:矢量和栅格两格结构的特征。
一 矢量数据结构
(1)矢量:具有大小和方向的量的向量
(2)矢量数据结构:基于矢量模型的数据结构即为矢量数据,是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式。
(3)矢量数据结构的特点:
A 能最好地逼近地理实体的空间分布特征
B 数据精度高
C 数据存储的冗余度低
D 便于进行地理实体的网络分析
E 对于多层数据的叠合分析比较困难
(一)矢量数据结构的类型
1、简单数据结构
只记录空间对象的位置坐标和属性信息,不记录拓扑关系(又称面条结构)。
存储:(1)独立存储:空间对象位置直接跟随空间对象;
(2)点位:点坐标独立存储,线、面由点号组成
特征:(1)无拓扑关系,主要用于显示、输出及一般查询;
(2)公共边重复存储,数据冗余,难以保证数据独立性;和一致性多边形分解和合并不易进行,邻域处理较复杂
(3)处理嵌套多边形比较麻烦。简单数据结构适用范围:制图及一般查询,不适合复杂的空间分析。
2、拓扑数据结构
定义:包括DIME(对偶独立地图编码法,由美国人口调查局建立)、POLYVRT(多边形转换器,由美国计算机图形及空间分析实验室创立)、TIGER(地理编码和参照系统的拓扑集成)等。
特点:(1)点是相互独立的,点连成线,线构成面。
(2)每条线始于起始结点(FN)止于终止结点(TN)并与左右多边形(LP和RP)相邻接。
(3)构成多边形的线又称为链段和弧段,两条以上的弧段相交的点称为结点,由一条弧组成的多边形称为岛,多边形中不含岛的多边形称为简单多边形,表示单连通区域含岛的多边形称为复合多边形,表示复连通区域。
拓扑结构:全显式表达
拓扑结构:部分显式表达
用上述部分表格表示空间目标的拓扑关系:
(1)System9:面-弧 、弧-点
(2)DIME:弧-点、弧-面
DIME是美国人口调查局在人口调查的基础上发展起来的,它通过有向编码建立了多边形、边界、节点之间的拓扑关系,DIME编码成为其它拓扑编码结构的基础。目前商用GIS还没有超出上述四个表格的拓扑关系
GIS中引入拓扑关系的优缺点
(1)优点
A 描述点、线、面的空间关系不完全依赖于具体的坐标位置。
B 空间关系信息丰富、简洁,数据冗余小。
C 方便多边形和多边形的叠合。
D 便于检查数据输入过程中的错误。
(2)缺点
A 拓扑关系建立过程比较复杂
B 数据结构本身复杂
空间对象关系表达
如何描述空间对象之间的空间相互作用关系?
1、方法
绝对关系: 坐标、角度、方位、距离等;
相对关系:相邻、包含、关联等
2、相对关系类型
拓扑空间关系:描述空间对象的相邻、包含等
顺序空间关系:描述空间对象在空间上的排列次序,如前后、左右、东、西、南、北等。
3、度量空间关系:描述空间对象之间的距离等。
空间对象关系表达
A:地图、遥感影象上的空间关系是通过图形识别的,在GIS中的空间关系则必须显式的进行定义和表达。
B:空间关系的描述多种多样,目前尚未有具体的标准和固定的格式,但基本原理一致。不同的GIS可能采用不同的方法进行描述
拓扑结构:是否需要拓扑结构?
可以根据应用目的:
制图或一般查询,可不要拓扑结构
空间分析,则应建立拓扑关系
也可以根据服务对象和系统数据结构:
面状目标:面-弧、弧-面
网络目标:点-弧、弧-点
3、曲面数据结构
曲面指连续分布现象的覆盖表面,具有这种覆盖表面的地理要素有地形、降水量、温度、磁场等。表示和存储这些要素的基本要求是必须便于连续现象在任一点的的内插计算。常用不规则三角网来拟合连续分布现象的覆盖表面,称为TIN。主要采用狄洛尼三角网来拟合地形信息。
狄洛尼三角网遵守平面图形的欧拉公式
欧拉公式:凸多面体的顶点数(n),棱数(m)及面数(r)之间的关系式:n – m + r = 2
二 栅格数据结构
1、栅格数据结构:基于栅格模型的数据结构,即指将空间分割成有规则的网格,在各个网格上给出相应的属性值来表示地理实体的一种数据组织形式。
2、地理要素的表示方法:
(1)点:由一个单元网格表示,其数值与近邻网格值明显不同;
(2)线:线段由一串有序的相互连续的单元网格表示,各个网格的值比较一致,但与领域的值差异较大;
(3)多边形:由聚集在一起的相互连接的单元网格组成,区域内部的网格值相同或差异较小,与领域网格的值差异较大。
3、网格边长决定栅格数据的精度,通常,网格越大,精度越小。
如何合理的选择网格尺寸选择:H=1/2({Ai })1/2 。式中:i=1,2,……n(区域多边形数),A是研究区域最小图斑的面积
4、栅格数据结构特点(与矢量数据结构相比较)
优点:(1)表达地理要素比较直观;
(2)容易实现多元数据的叠合操作;
(3)便于与遥感图像及扫描输入数据相匹配建库和使用等。
缺点:(1)存储空间大;(2)由于相邻栅格单元属性值的相关性,造成栅格数据的冗余度;
(3)栅格数据对于网络分析和建立网络连接 关系比较困难。
5、栅格数据获取方式:遥感数据;图片扫描数据;矢量数据转换;手工方式
(一)栅格数据结构的类型
1、栅格矩阵结构:是一种全栅格阵列的空间数据组织形式。特点:储存需占空间大。若一个栅格单元为2个字节,则一个矩阵M行,N列的栅格图像存储空间为:M*N*2(字节)。
A B B
A A B
A A A
在计算机内是一个3*3阶的矩阵。但在外部设备上,通常是以左上角开始逐行逐列存贮。如上例存贮顺序为:A B B A A B A A A
当每个像元都有唯一一个属性值时,一层内的编码就需要m行×n列×每个单元占的字节数(x,y和属性编码值)个存储单元。数字地面模型就属此种情况。
例:若一个面积为100km2的区域,如果网格的边长取1m,每个网格用一个字节表示,刚一个图层的要素占200M字节的存储空间。
2、游程编码结构
游程:指相邻同值网格的数量。
游程编码结构:是逐行将相邻同值的网格合并,并记录合并后网格的值及合并网格的长度。
目的:压缩栅格数据量,消除数据间的冗余。
(1)游程编码建立的方法:将栅格矩阵的数据序列X1, X2 …… Xn ,映射为相应的二元组序列(Ai,Pi ),i=1,k,且k《n。A为属性值,P为游程,K为游程序号。
(2)图层的数据冗余度Re: Q为图层内相邻属性值变化次数的累加和;M为图层网格的行数; N为图层网格的列数。若Re大于20%栅格数据的压缩效果明显。压缩效果用压缩比:这里n表示压缩前的存储容量,k表示压缩后的存储容量。
例:一平方公里的正方形区域,建立栅格数据,取栅格数据的网格边长为10米,建立了一个100*100的栅格矩阵,若每个栅格矩阵的数据用一个8位码表示,需用空间10000个字节,而采用游程长度压缩码表示时,建立的游程总数为500个,每个游程用一个双字节来表示,则压缩比:10:1
(3)游程编码数据的组织形式:采用索引文件的方法来组织数据,访问效率快。
3 四叉树编码结构
四叉树数据结构存储的原理:
(1)自上而下的方法
将一幅栅格地图或图象等分为四部分。逐块检查其格网属性值(或灰度)。如果某个子区的所有格网值都具有相同的值,则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。这样递次地分割,直到每个子块都只含有相同的属性值或灰度为止。凡数值呈单调的单元,不论单元大小,均作最后的存储单位。这四个等分区称为四个子象限,按顺序为左上(NW)、右上(NE)、左下(SW)、右下(SE)。用一个树结构表示,如前所述,这种自上而下分割的方法需要大量重复运算,因而应用得比较少。
1、对于一个n×n(n=2k,k>1)的栅格方阵组成的区域作四叉树编码,其中k称为分辨率。第一分割四个子象限,它们分别包括:
2、如果要再分割下一层,其子象限分别为:
栅格数据结构的特点
1、离散的量化栅格值表示空间对象
2、位置隐含,属性明显
3、数据结构简单,易于遥感数据结合,但数据量大
4、几何和属性偏差
5、面向位置的数据结构,难以建立空间对象之间的关系
三、矢量与栅格一体化数据结构
1、矢量与栅格一体化的基本概念;
(1)四库合一:新一代集成化的地理信息系统,能够统一管理图形数据、属性数据、影像数据和数字高程模型数据。
(2)矢量与栅格一体化数据结构:矢量与栅格数据统一起来,既具有矢量特性,又具有栅格性质。如线状实体:除记录原始取样点,还要记录所通过的栅格。面状地物:除记录它的多边形边界外,还记录中间包含的栅格。
(3)矢量与栅格化数据结构的存储:
A 点状目标:表示点的一个位置数据及与结点关联的弧段信息。
B 线状目标:用一组土元子来填满整个路径,并表示该弧段相关的拓扑信息。
C 面状目标:由元子填满路径的一组边界和边界组成的空间。
三、矢量与栅格一体化数据结构
2、矢量与栅格一体化的数据结构设计
(1)点状目标和结点的数据结构:将点坐标化为两个地址码。其结构如:结点数据结构简化:结点标识号 M1 M2 高程Z 关联弧段
(2)线状目标和弧段数据结构:线状目标点要将其通过的栅格地址全部记录下来,先记录线状地物的弧段的数据文件。其文件结构可简化为:弧标识号 始结点 终结点 左区 右区 中间点串(M1,M2…Mz)
(3)面状目标的数据结构
面状目标应包含边界和边界所包围的整个区域。边界由弧段组成,关联弧段构成多边形区域,通过关联弧段与弧段数据的连接,可建立多边形与弧段之间的拓扑关系。面状目标的中间采用栅格或者游程数据结构表示。
面状目标及其数据结构简化:多边形标识号 关联弧段 面块头指针(M码)
面块头指针:是指向该目标的下一个子块的记录或地址码,并在最后指向该目标的对应属性值。
矢量与栅格数据结构的比较
空间数据结构的建立:是指根据确定的数据结构类型,形成与该数据结构相适应的GIS空间数据,为空间数据库的建立提供物质基
础。
第四节 空间数据结构的建立
一、系统功能与数据间的关系
现代地理信息系统数据模式的一个重要特征是数据与功能之间具有密切的联系(见下表),因此,在确定数据内容时,首先必须明确系统的功能;
对开发的GIS系统的功能,是通过用户需求调查来确定的,因此,在开发GIS系统之前,首先要进行系统分析。
二、空间数据的分类和编码
(一)空间数据的分类:是指根据系统功能及国家规范和标准,将具有不同属性或特征的要素区别开来的过程,以便从逻辑上将空间数据组织为不同的信息层,为数据的采集、存储、管理、查询和共享提供依据。
(二)空间数据的编码:是指将数据分类的结果,用一种易于被计算机和人识别的符号系统表示出来的过程。编码的结果是形成代码。代码由数字或字符组成。例如,我国基础地理信息数据的分类代码由六位数字组成,其代码结构如下所示:
三 数据的输入与编辑
(一)矢量数据的输入与编辑
1、矢量的输入,是指将分类和编码的空间对象图形转换为一系列x、y坐标,然后按照确定的数据结构加入到线段或标示点的计算机数据文件中去;
2、空间数据编辑的目的是为了消除数字化过程中引入的各类错误和对数据进行拓扑关系检查等而进行的操作。
(二) 栅格数据的输入与编辑
1、栅格数据的输入过程是产生和栅格数据结构相适应的GIS空间数据的过程。
2、栅格数据的输入方法包括透明格网采集输入、扫描数字化输入及其它数据传输或转换输入等;
透明格网采集输入的步骤:A:首先准备一张聚脂薄膜透明网格,格网的尺寸依要求而定;
B:将此格网叠置于原图上,根据单位格网交点归属法,单位格网面积占优法等可以直接获取相应的栅格数据。
常见数据输入错误
图纸移动、图纸变形、制图误差、数字化误差,各种误差将影响到GIS数据处理的各个环节
展开阅读全文