1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章,GIS,中的数据,1,1,数据的涵义,数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。,数据的,处理,和,解释,是非常重要的环节。所谓,数据处理,,是指对数据进行收集、筛选、排序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于观察、分析、传输或进一步处理的形式;数据处理是为了解释,而数据解释需要人的智慧、学识和经验。,1,数据涵义与数据类型,1.2,地理数据(空间数据)的基本特征,地
2、理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特征,例如变量、级别、数量特征和名称等等。空间特征(定位数据):表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等。时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等等(图,3-1,)。,图,3,1,空间数据的基本特性,1,3,空间数据的类型,在地理信息系统中,按照其特征,数据可分为三种类型:空间特征数据(定位数据)、时间属性数据(尺度数据)和专题属性数据(非定位数据)。对于绝大部分地理信息系统的应用来说,时间和专题属性数据
3、结合在一起共同作为属性特征数据,而空间特征数据和属性特征数据统称为空间数据(或地理数据)。,1,3,1,空间特征数据,空间特征数据记录的是空间实体的位置、拓扑关系和几何特征,这是地理信息系统区别于其他数据库管理系统的标志。空间特征指空间物体的位置、形状和大小等几何特征,以及与相邻物体的拓扑关系。位置和拓扑特征是地理或空间信息系统所独有的,空间位置可以由不同的坐标系统来描述,如经纬度坐标、一些标准的地图投影坐标或是任意的直角坐标等。人类对空间目标的定位一般不是通过记忆其空间坐标,而是确定某一目标与其他更熟悉的目标间的空间位置关系,而这种关系往往也是拓扑关系。如一所学校位于哪个路口或哪条街道。,1
4、3,2,专题特征数据,专题特征指的是地理实体所具有的各种性质,如地形的坡度、坡向、某地的年降雨量、土地酸缄类型、人口密度、交通流量、空气污染程度等。这类特征在其他类型的信息系统中均可存储和处理。专题属性特征通常以数字、符号、文本和图像等形式来表示。,1,3,3,时间特征数据,时间属性是指地理实体的时间变化或数据采集的时间等。严格地讲,空间数据总是在某一特定时间或时段内采集得到或计算产生的。由于有些空间数据随时间变化相对较慢,因而有时被忽略;有些时候,时间可以被看成一个专题特征。,1,4,空间数据的表示方法,一般地,表示地理现象的空间数据可以细分为:,类型数据:,例如考古地点、道路线和土壤类型
5、的分布等;,面域数据:,例如随机多边形的中心点、行政区域界线和行政单元等;,网络数据:,例如道路交点、街道和街区等;,样本数据:,例如气象站、航线和野外样方的分布区等;,曲面数据:,例如高程点、等高线和等值区域;,文本数据:,例如地名、河流名称和区域名称;,符号数据:,例如点状符号、线状符号和面状符号(晕线)等(如图,3-2,所示)。,图,3-2,2,数据的测量尺度,对特定现象的测量就是根据一定的标准对其赋值或打分。为了描述地理世界,对任何事物都要鉴别、分类和命名。这些都是量测的组成部分。它们所使用的参考标准或尺度是不同的。测量的尺度大致可以分成四个层次,由粗略至详细依次为:命名或类型、次序、
6、间隔以及比例。,2,1,命名(,Nominal,)量,定性而非定量,不能进行任何算术运算,如一个城市的,名字。,2,2,次序(,Ordinal,)量,线性坐标上不按值的大小,而是按顺序排列的数,例,如,事故发生危险程度的级别由大到小被标为,1,,,2,,,3,,,,级别的序号越低,其危险性越大,但危险性到底,有多大并未给予定量的表达。序数值相互之间可以比较,大小,但不能进行加、减、乘、除等算术运算。,2,3,间隔(,Interval,)量,不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的。,2,4,比率(,Ratio,)量,比例
7、测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺度与使用的测量单位无关。,与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性域的例子很多,如年降雨量、海拔高度、人口密度、发病率等。,图,3-3,:各种数据测量尺度以及其制图表现,3,地理信息系统的数据质量,地理信息系统是一个基于计算机软件、硬件和数据的集成系统,该系统主要通过空间及非空间数据的操作,实现空间检索、编辑及分析功能。,GIS,中数据质量的优劣,决定着系统分析质量以及整个应用的成败。,3,1,数据质量的基本,概念,3,1,1,准确性(,Accuracy,),即一个记录值(测量或观察值)
8、与它的真实值之间的接近程度。,3,1,2,精度(,Precision,),即对现象描述的详细程度。如对同样的两点,精度低的数据并不一定准确度也低。精度要求测量能以最好的准确性来记录,但是这可能误导提供了较大的精度,因为超出一个测量仪器的已知准确度的数字在效率上是冗于的。,3,1,3,空间分辨率,(Spatial Resolution),分辨率是两个可测量数值之间最小的可辩识的差异。那么空间分辨率可以看作记录变化的最小距离。在一张用肉眼可读的地图上,假设一条线用来记录一个边界,分辨率通常由最小线的宽度来确定。地图上的线很少以小于,0.1mm,的宽度来画。,3,1,4,比例尺(,Scale,),比
9、例尺是地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。地图的比例尺将决定地图上一条线的宽度所表现的地面的距离。,3,1,5,误差(,Error,),3,1,6,不确定性(,Uncertainty,),地理信息系统的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性。空间位置的不确定性指,GIS,中某一被描述物体与其地面上真实物体位置上的差别;属性不确定性是指某一物体在,GIS,中被描述的属性与其真实的属性之差别;时域不确定性是指在描述地理现象时,时间描述上的差错;逻辑上的不一致性指数据结构内部的不一致性,尤其是指拓扑逻辑上的不一致性;
10、数据的不完整性指对于给定的目标,,GIS,没有尽可能完全地表达该物体。,3,2,空间数据质量问题的来源,从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用,在这两个过程中都会有数据质量问题的发生。,3,2,1,空间现象自身存在的不稳定性,3,2,2,空间现象的表达,3,2,3,空间数据处理中的误差,3,2,4,空间数据使用中的误差,数据的主要误差来源,数据处理过程,误差来源,数据搜集,野外测量误差:仪器误差、记录误差,遥感数据误差:辐射和几何纠正误差、信息提取误差,地图数据误差:原始数据误差、坐标转换、制图综合及印刷,数据输入,数字化误差:仪器误差、操作误差,不同系统格
11、式转换误差:栅格,-,矢量转换、三角网,-,等值线转换,数据存储,数值精度不够,空间精度不够:每个格网点太大、地图最小制图单元太大,数据处理,分类间隔不合理,多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差,比例尺太小引起的误差,数据输出,输出设备不精确引起的误差,输出的媒介不稳定造成的误差,数据使用,对数据所包含的信息的误解,对数据信息使用不当,3,3,常见空间数据的误差分析,归纳起来,数据的误差主要有四大类,即几何误差、属性误差、时间误差和逻辑误差。在这几种误差中,属性误差和时间误差与普通信息系统中的误差概念是一致的,几何误差是地理信息系统所特有的,而几何误差、属性误差和时间误差
12、都会造成逻辑误差,因此下面主要讨论逻辑误差和几何误差。,3,3,1,误差的类型,1,)逻辑误差,对数据进行质量控制或质量保证或质量评价,一般先从数据的逻辑性检查入手。如图,3-4,所示,其中桥或停车场等与道路是相接的,如果数据库中只有桥或停车场,而没有与道路相连,则说明道路数据被遗漏,使数据不完整。,图,3-4,2,)几何误差,由于地图是以二维平面坐标表达位置,在二维平面上的几何误差主要反映在点和线上。,点误差,关于某点的点误差即为测量位置(,x,,,y,)与其真实位置(,x0,,,y0,)的差异。,线误差,线性特征的线误差及在确定线的界限时的误差,被称为解译误差,.,3,3,2,地图数据的质
13、量问题,1,)地图固有误差:是指用于数字化的地图本身所带有的误差,包括控制点误差、投影误差等。,2,)材料变形产生的误差:这类误差是由于图纸的大小受湿度和温度变化的影响而产生的。,3,)图象数字化误差,3,3,3,遥感数据的质量问题,遥感数据的质量问题,一部分来自遥感仪器的观测过程,一部分来自遥感图象处理和解译过程。,3,3,4,测量数据的质量问题,测量数据主要指使用大地测量、,GPS,、城市测量、摄影测量和其他一些测量方法直接量测所得到的测量对象的空间位置信息。这部分数据质量问题,主要是空间数据的位置误差。,3.4,空间数据质量控制,数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生
14、和扩散的所有过程和环节入手,分别用一定的方法减少误差。空间数据质量控制常见的方法有:,3,4,1,传统的手工方法,质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。,3,4,2,元数据方法,数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。,3,4,3,地理相关法,用空间数据的地理特征要素自身的相关性来分析数据的质量。如从地表自然特征的空间分布着手分析,山区河流应位于微地形的
15、最低点,因此,叠加河流和等高线两层数据时,如河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将它们分别与其它质量可靠的数据层叠加来进一步分析。因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用。,4,空间数据的元数据,Metadata,可以译成元数据,是描述数据的数据。在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。,元数据的内容包括:,1,)对数据集的描述;对数据集中各数据项、数据来源、数据所有者及数据序代(数据生产历史)等的说明;,2,)对数据质量的描述
16、如数据精度、数据的逻辑一致性、数据完整性、分辨率、元数据的比例尺等;,3,)对数据处理信息的说明,如量纲的转换等;,4,)对数据转换方法的描述;,5,)对数据库的更新、集成等的说明。,在地理信息系统应用中,元数据的主要作用可以归纳为如下几个方面:,1,)帮助数据生产单位有效地管理和维护空间数据、建立数据文档,并保证即使其主要工作人员离退时,也不会失去对数据情况的了解;,2,)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索地理空间数据;,3,)帮助用户了解数据,以便就数据是否能满足其需求做出正确的判断;,4,)提供有关信息,以便
17、用户处理和转换有用的数据。,可见,元数据是使数据充分发挥作用的重要条件之一,它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。,空间数据元数据的应用,帮助用户获取数据,通过元数据,用户可对空间数据库进行浏览、检索和研究等。一个完整的地学数据库除应提供空间数据和属性数据外,还应提供丰富的引导信息,以及由纯数据得到的分析、综述和索引等。,空间数据质量控制,在数据集成中的应用,数据集层次的元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型等信息;系统层次和应用层次的元数据则记录了数据使用软硬件环境、数据使用规范、数据标准等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在各平台之间的转换使用等是必要的。这些信息能够使系统有效地控制系统中的数据流。,






