1、地理实体编码技术与方法一、地理编码技术得概念一、地理编码技术得概念名词解释名词解释标识:如身份证;更新、关联、共享、交换等识别:定量信息可以被计算机直接识别,而定性信息通 过一种编码方法输入计算机中;整合:地址空间范围(即行政区,人口普查区,街道)内进 行信息得整合、统计与计算统计与计算;定位:基于空间位置得信息服务;寻址:地址解析器:寻址位置。一、地理编码技术得概念一、地理编码技术得概念为什么?为什么?广义地理编码广义地理编码:地理对象空间位置标识、计算与处理得过程地理对象空间位置标识、计算与处理得过程,狭义得地理编码狭义得地理编码:即地址匹配即地址匹配(Address Matching),
2、指建立指建立地理位置坐标与给定地名地址一致性得过程地理位置坐标与给定地名地址一致性得过程,这里得地址已较为明确得这里得地址已较为明确得指代为街道地址、行政区域等指代为街道地址、行政区域等,其地理对象也明确为地理实体。其地理对象也明确为地理实体。地理对象地理对象:地理实体、地理要素类、地理区域与范围等。地理实体、地理要素类、地理区域与范围等。地理对象在确定得参考系中按一定得规则赋予唯一得、可地理对象在确定得参考系中按一定得规则赋予唯一得、可识别得代码识别得代码,唯一地确定地理对象得空间位置唯一地确定地理对象得空间位置,建立地理对建立地理对象与代码之间得映射关系象与代码之间得映射关系,它可以就是地
3、理对象与地址得映它可以就是地理对象与地址得映射射,也可以就是地理对象与坐标系统得映射。也可以就是地理对象与坐标系统得映射。一、地理编码技术得概念一、地理编码技术得概念定义定义地理编码技术:编码、解析、地址匹配 (1)编码得基本规则与编码方式编码得基本规则与编码方式;(2)智能语义解析算法智能语义解析算法,智能化中文地址模糊匹配算法智能化中文地址模糊匹配算法实现自然语言得地址与标准地址编码数据库得智能 匹配,获得最精确得地理编码与地理坐标;(3)编码器、解析器与匹配器编码器、解析器与匹配器根据编码方案规则或者就是既有标准进行地理编码;根据编码规则对输入得实体进行解析;根据地理编码去识别、定位、寻
4、址等。二、地理编码技术与方法二、地理编码技术与方法1、基于地理格网得地理编码、基于地理格网得地理编码地理格网就是按一定得数学规则对地球表面进行分割地理格网就是按一定得数学规则对地球表面进行分割,形成彼此邻形成彼此邻接又不交叉得多个多边形接又不交叉得多个多边形(四边形、三角形四边形、三角形),并赋予标识符并赋予标识符(即地即地理编码理编码)。采用地理对象与地址通过格网建立相对关联得方法。采用地理对象与地址通过格网建立相对关联得方法,建立建立地理对象得地址属性。实质就是对地理对象得二维地理位置编码地理对象得地址属性。实质就是对地理对象得二维地理位置编码(实体实体地理位置、格网坐标地理位置、格网坐标
5、)与解码与解码(地理位置、格网坐标地理位置、格网坐标实体实体)。其实就就是表示地理实体在地理格网中位置定位信息其实就就是表示地理实体在地理格网中位置定位信息(直接指明或直接指明或者给定一个大小视地理编码精度而定得范围者给定一个大小视地理编码精度而定得范围),当建立格网之后当建立格网之后,地地理对象与编码理对象与编码(格网标识格网标识)之间得对应关系被唯一得确定了。之间得对应关系被唯一得确定了。优点优点:定位精确定位精确,精度可控制。精度可控制。缺点缺点:难以建立地理对象之间得空间拓扑关系难以建立地理对象之间得空间拓扑关系,需要建立一整套严密得需要建立一整套严密得从大地基准、参考椭球、投影方式、
6、格网得规定、格网原点、格网从大地基准、参考椭球、投影方式、格网得规定、格网原点、格网划分规则、格网标识编码以及格网精度等各个方面去描述得格网系划分规则、格网标识编码以及格网精度等各个方面去描述得格网系统统,需要考虑包括确定编码得最小地理对象或单元在内得多种因素。需要考虑包括确定编码得最小地理对象或单元在内得多种因素。二、地理编码技术与方法二、地理编码技术与方法2、基于地理实体得地理编码、基于地理实体得地理编码 采用地理实体与地址建立直接关联得方法采用地理实体与地址建立直接关联得方法,建立地理实体得地址属建立地理实体得地址属性。将地址、门牌、建筑物名、企事业单位名称等空间位置得自然语性。将地址、
7、门牌、建筑物名、企事业单位名称等空间位置得自然语言描述转化为地址编码言描述转化为地址编码,实质就就是建立地理实体与地址实质就就是建立地理实体与地址(空间位置空间位置)得一一对应关系得一一对应关系,也就是对地理对象得二维地理位置编码也就是对地理对象得二维地理位置编码(实体实体地地址址)与解码与解码(地址地址实体实体)。它一般建立在基于坐标得空间参考系中。它一般建立在基于坐标得空间参考系中。如如“市政监管信息化市政监管信息化 地理编码地理编码”。优点优点:易于被大家接受易于被大家接受,符合人们惯用得思维方式符合人们惯用得思维方式缺点缺点:在于中文地址本身得不规范性与重复性在于中文地址本身得不规范性
8、与重复性,使得这种编码方式存在使得这种编码方式存在技术上得难点。技术上得难点。二、地理编码技术与方法二、地理编码技术与方法1、明确地理对象、明确地理对象 明确需要编码得地理对象明确需要编码得地理对象,地理对象不同则实现得方法不同地理对象不同则实现得方法不同;2、确定得参考系统、确定得参考系统 可以就是基于坐标得或就是基于地理标识得可以就是基于坐标得或就是基于地理标识得,地址就就是一种建立地址就就是一种建立在地理标识参考系下使用自然语言描述地理位置得参考系统在地理标识参考系下使用自然语言描述地理位置得参考系统;3、唯一得编码规则、唯一得编码规则地理编码也就是一种数据组织、数据模型建立或就是已有数
9、据重新组地理编码也就是一种数据组织、数据模型建立或就是已有数据重新组织得过程。它也就是一种地理空间得间接参考系织得过程。它也就是一种地理空间得间接参考系,就是整合多源空间信就是整合多源空间信息资源得一个重要环节息资源得一个重要环节,成为基础地理信息数据作为空间基础框架整合成为基础地理信息数据作为空间基础框架整合信息资源得重要手段。信息资源得重要手段。二、地理编码技术与方法二、地理编码技术与方法几个要素几个要素1、一种地理对象、一种地理对象在地理编码得三个要素中在地理编码得三个要素中,地理对象决定着参考系统得采用与编码规则地理对象决定着参考系统得采用与编码规则得确定得确定,也决定着地理编码采用得
10、方法。地理对象应尽可能只就是一种也决定着地理编码采用得方法。地理对象应尽可能只就是一种,或者就是地理实体或者就是地理实体,或就是地理区域或就是地理区域,多种地理对象同时进行地址编码多种地理对象同时进行地址编码时时,会因为地理概念、地理区域与实体在空间得关系中得相关性等产生会因为地理概念、地理区域与实体在空间得关系中得相关性等产生问题问题,影响地址编码规则得实现。影响地址编码规则得实现。2、明确最小地理对象、明确最小地理对象明确最小地理对象明确最小地理对象(或称最小地理单元或称最小地理单元)得划分得划分,对于地理编码得实现对于地理编码得实现也具有不可忽视得作用也具有不可忽视得作用,试想以城市管理
11、得每一个部件试想以城市管理得每一个部件(一个信箱、信一个信箱、信号灯等号灯等)作为最小地理对象与以街道、单位为最小地理对象得地理编作为最小地理对象与以街道、单位为最小地理对象得地理编码将会存在很大得不同。最小地理对象尽可能不可再分、相互不重叠、码将会存在很大得不同。最小地理对象尽可能不可再分、相互不重叠、或在一个工作平面上可以连续分割空间且不交叉应该就是最小地理对或在一个工作平面上可以连续分割空间且不交叉应该就是最小地理对象划分得基本原则。象划分得基本原则。二、地理编码技术与方法二、地理编码技术与方法注意得问题注意得问题三、三、三、三、地理实体编码存在得问题地理实体编码存在得问题国家国家地理实
12、体数据规范地理实体数据规范中指出中指出:地理实体数据使用地理实体标识码、图元得标识码、地理实体数据使用地理实体标识码、图元得标识码、信息分类码三类编码。信息分类码三类编码。编码时编码时,尽量采用已有国家标准或行业标准尽量采用已有国家标准或行业标准,必要时可必要时可以进行组合与扩充。以进行组合与扩充。1 1、信息分类编码、信息分类编码地理实体数据规范地理实体数据规范中分类代码采用已颁布得中分类代码采用已颁布得6 6位基础测绘分类编码体系。位基础测绘分类编码体系。浙江省基础地理信息要素分类与代码浙江省基础地理信息要素分类与代码在在6 6位编位编码基础上增加码基础上增加1 1位特征码与位特征码与2
13、2位图形码。位图形码。*测绘基础分类码测绘基础分类码 特征码特征码 图形码图形码 特征码特征码:点、线、面、有向点、有向线、面、注记点、线、面、有向点、有向线、面、注记 图形码图形码:点点(坐标、高程、符号定位点坐标、高程、符号定位点)三、三、地理实体编码存在得问题地理实体编码存在得问题大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点2 2、地理实体标识码、地理实体标识码第一类就是根据要素等级划分。第一类就是根据要素等级划分。采用此类划分得有采用此类划分得有:行政区划、水系、境界、居
14、民地、地址行政区划、水系、境界、居民地、地址以行政区划为例以行政区划为例:依次从上至下记录所有等级对应得代码依次从上至下记录所有等级对应得代码,再结合面积等其她自身属性生成唯一再结合面积等其她自身属性生成唯一得地理实体代码得地理实体代码,这种编码得优点就是可以获得该地理实体比较多得信息。这种编码得优点就是可以获得该地理实体比较多得信息。三、三、地理实体编码存在得问题地理实体编码存在得问题2 2、地理实体标识码、地理实体标识码第二类就是由行政区域与顺序码组成第二类就是由行政区域与顺序码组成。采用此类划分得有采用此类划分得有:道路。以道路为例道路。以道路为例:由由6 6位行政区划代码与位行政区划代
15、码与1010位道路顺序代码组成。编码方式除了行政区划位道路顺序代码组成。编码方式除了行政区划码具有确定意义得定位信息以外码具有确定意义得定位信息以外,其她均为相对得、比较随机得编码方式其她均为相对得、比较随机得编码方式,优点优点就是可以采用程序自动得赋予编码就是可以采用程序自动得赋予编码,较大得减少了人工得工作量较大得减少了人工得工作量三、三、地理实体编码存在得问题地理实体编码存在得问题3 3、图元标识码、图元标识码(Element IDElement ID,ElemIDElemID)唯一标识构成实体得点、线、面图元唯一标识构成实体得点、线、面图元地理实体数据规范地理实体数据规范中图元标识码共
16、中图元标识码共23 23 位位,结构如下结构如下:6 61 11616三、三、地理实体编码存在得问题地理实体编码存在得问题四、地理实体编码方案设计四、地理实体编码方案设计实体编码解决得问题实体编码解决得问题1 1、不同比例下得地理实体关联、不同比例下得地理实体关联2 2、多行业得地理实体共享、多行业得地理实体共享不同行业对同一实体得位置、固有属性得描述一般相同不同行业对同一实体得位置、固有属性得描述一般相同,主要区别在于对主要区别在于对地理实体得类别划分。地理实体得类别划分。3 3、重大地理实体得描述方式、重大地理实体得描述方式:a a、自然要素、自然要素(河流、山脉河流、山脉):):需要顾及
17、自然界得流域体系与隶属关系需要顾及自然界得流域体系与隶属关系b b、人工要素、人工要素(道路、居民地道路、居民地):):需要顾及行政区域、道路等级等人文因素需要顾及行政区域、道路等级等人文因素4 4、地理实体与图元得界定、地理实体与图元得界定实体一般由多个具有相同名称得邻接图元组成实体一般由多个具有相同名称得邻接图元组成,故名称与图元拓扑关系就是故名称与图元拓扑关系就是界定实体得重要标识。界定实体得重要标识。目前我们得实体划分层次关系到关系到“层次编码层次编码”,河流河流 水库水库 湖泊湖泊 公路公路 街道街道 地名地址地名地址一级流域一级流域 一级流域一级流域 一级流域一级流域 所属类别所属
18、类别 所属类别所属类别 街道名、小区名街道名、小区名二级流域二级流域 二级流域二级流域 化学性质化学性质 门门(楼楼)址、址、标志物名、兴趣点名标志物名、兴趣点名河流类别河流类别 所在河流所在河流 兴趣点按行业兴趣点按行业分为分为13子类子类四、地理实体编码方案设计四、地理实体编码方案设计水库实体编码河流实体编码湖泊实体编码1)水系类标识码水系类标识码四、地理实体编码方案设计四、地理实体编码方案设计公路实体编码2)交通类标识码交通类标识码街道实体编码四、地理实体编码方案设计四、地理实体编码方案设计3)地名地址类标识码地名地址类标识码4)行政区划类标识码行政区划类标识码四、地理实体编码方案设计四
19、、地理实体编码方案设计3、图元编码设计、图元编码设计A、图元编码结构、图元编码结构(后后26位编码均采用位编码均采用16进制进制):*行号行号 列号列号 级别级别 代表点相对代表点相对X 代表点相对代表点相对Y 面积面积/长度长度 方位编码方位编码1、选取、选取27N、118E为坐标原点为坐标原点,最大格网南北纬差最大格网南北纬差5、经差、经差5,此网格为覆盖浙此网格为覆盖浙江全省最大网格江全省最大网格(边长边长556596米米)。2、然后将经纬度转换为以米为单位、然后将经纬度转换为以米为单位,可知原点坐标为可知原点坐标为(-278298,-278298),最大网最大网格边长为格边长为5565
20、98 米米,最小网格边长最小网格边长1米米,行列号最大值为行列号最大值为87E35,网格划分为网格划分为20等级。等级。四、地理实体编码方案设计四、地理实体编码方案设计五、地理实体编码生成与实现五、地理实体编码生成与实现五、地理实体编码生成与实现五、地理实体编码生成与实现1、编码生成方法、编码生成方法分类编码编译分类编码编译测绘行业测绘行业:按照行业标准按照行业标准,在数据采集时生成行业基础分类码。在数据采集时生成行业基础分类码。其她行业其她行业:依据来源行业信息依据来源行业信息,从来源数据要素分类编码中提取所需要素分类编从来源数据要素分类编码中提取所需要素分类编码字段码字段,依照行业分类对照关系依照行业分类对照关系,转换生成行业基础分类码。转换生成行业基础分类码。行业编码行业编码:参照参照政务信息资源目录体系政务信息资源目录体系行业编码生成。行业编码生成。