1、中国科技信息 2024 年第 1 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Jan.2024-86-两星推荐随着地理信息技术的不断发展,经纬度计算在许多领域中得到了广泛的应用,然而,如何高效地进行经纬度计算仍然是一个挑战。近年来,Redis 作为一个内存中的数据结构存储系统提供了 GEO 算法的支持,该算法可以处理不同类型的数据,从而高效地进行地理位置查询和计算。本文将对经纬度计算与 Redis 的 GEO 算法进行对比,探讨各自的优缺点,并给出结论。Redis 的 GEO 算法提供了一种高效的方法来处理地理位置数据。它利用哈希表和空间索引技术,能够快
2、速地进行地理位置查询和计算。与传统的数据库查询相比,Redis 的GEO 算法具有更高的性能和更低的延迟。Redis 还提供了丰富的数据结构和命令,使得开发者能够轻松地处理地理位置数据。经纬度计算也有其独特的优势,特别是在处理高精度地图数据时,它能够提供更精确的地理位置信息。并且,经纬度计算可以与 GIS 技术相结合,实现更复杂的地理空间分析(GIS 代表地理信息系统,是一种用于收集、存储、分析、管理和显示地理空间数据的技术)。此外,经纬度计算还可以应用于无人机、物联网等新兴领域,具有广阔的应用场景。传统经纬度计算与 Redis 的 GEO 算法各有优缺点。传统的经纬度计算可以提供更精确的地理
3、位置信息,从而使用于高精度地图数据和复杂的地理空间分析。在地理位置搜索与回溯方面,Redis 中的 GEO 算法则具有更高的性能和更低的延迟,使用有序集合以及相关的命令和函数来处理大量地理位置数据。其中有 GEOADD 命令来设置地理位置数据,GEORADIUS(该命令在 6.2 版本后废除)和 GEORADIUSBYMEMBER 命令根据给定的经纬度坐标和半径范围,在有序集合中进行范围搜索,6.2 版本后新增 GEOSEARCH 和 GEOSEARCHSTORE 命令来代替GEORADIUS 和 GEORADIUSBYMEMBER 命 令,这两个命令是按照指定的范围内搜索地理位置记录,这个范
4、围可以是圆形或者矩形,并按照与指定点的距离排序后返回,GEODIST 命令用于计算两个地理位置之间的距离。另外通过利用 Redis 的有序集合数据结构和其相关的命令可以实现地理位置搜索与回溯功能,例如 ZREVRANGE等命令从有序集合中按照排序值(即地理位置)的逆序获取数据,实现根据地理位置进行回溯查询,这为基于地理位置的应用场景提供了简单而高效的解决方案。在未来发展中,可以期待经纬度计算和 Redis 的 GEO 算法相互融合,共同推动地理位置信息技术的进步。行业曲线开放度创新度生态度互交度持续度可替代度影响力可实现度行业关联度真实度经纬度计算与 Redis 的 GEO 算法对比周喜平 杜
5、航勤 梁俊礼周喜平 杜航勤 梁俊礼郑州西亚斯学院通信作者:周喜平(1976),河南郑州,教授,华中科技大学计算机学院硕士,研究方向:软件工程。杜航勤(2002),河南新乡,本科。梁俊礼(2003),河南固始,本科。基金项目:河南省民办教育发展专项资金支持,豫财教 202116 号。-87-CHINA SCIENCE AND TECHNOLOGY INFORMATION Jan.2024中国科技信息 2024 年第 1 期两星推荐经纬度计算与 Redis的 GEO算法经纬度计算计算两个点的地理位置距离时,如图 1 中 A 点的经纬度为(lng1,lat1),B 点经纬度为(lng2,lat2),
6、假设地球半径为 R,求点 A,B 的距离 L。先将经纬度转化成点 A,B 的坐标。则点 A 坐标为:(cos(lat1)cos(lng1),cos(lat1)sin(lng1),sin(lat1)点 B 坐标为:(cos(lat2)cos(lng2),cos(lat2)sin(lng2),sin(lat2)设 lng 为点 A 经度与点 B 经度的差lng=lng1-lng2 (1)cos(A,B)的计算公式为:cos(A,B)=cos(lat1)cos(lat2)cos(lng)+sin(lat1)sin(lat2)(2)则球面距离 L 公式为:L=Rarccos(cos(A,B)(3)L=
7、Rarccos(cos(lat1)cos(lat2)cos(lng)+sin(lat1)sin(lat2)(4)Redis 的 GEO 算法使用 Redis 的 GEO 算法计算两点之间的距离时,需要用到以下两个语句来实现计算两点间距离的操作。geoadd 的 语 法 为:geoadd key longitude latitude member。geodist 的语法为:geodist key member1 member2 m|km|ft|mi。先 使 用 Redis GEO 算 法 中 的 geoadd 语 句 把 两个点的经纬度加入 redis 中,再使用 geodist 语句根据mem
8、ber1,member2 来 把 这 两 点 的 距 离 计 算 出 来。merber1,merber2 为 geoadd 加入 redis 中的两个地理位置(即地点名称)。距离单位有:m(米),km(千米),ft(英尺),mi(英里)。georadius 的语法为:georadius key longitude latitude radius m|km|ft|mi WITHCOORD WITHDIST WITHHASH COUNT ASC|DESC STORE key STOREDIST key。语法中,WITHDIST 为在返回位置元素的同时,将位置元素与中心之间的距离也一并返回;WITH
9、COORD 为将位置元素的经度和纬度一并返回;WITHHASH 为以 52 位有符号整数的形式,返回位置元素经过原始 geohash 编码的有序集合分值;COUNT 为限定返回的记录数;ASC 为查找结果根据距离从近到远排序;DESC为 查 找 结 果 根 据 从 远 到 近 排 序,georadiusbymember该 命 令 与 geodius 命 令 基 本 一 致。唯 一 不 同 的 是:GEORADIUSBYMEMBER 给定的是 Sorted Set 中的一个元素,而GEORADIUS给定的是具体经纬度。通过给定元素,其实就可以得到存储的经纬度,进而进行查询。geosearch,g
10、ensearchstore(6.2 之后新命令)。Geosearch 和 geosearchstore 语法:GEOSEARCH key FROMMEMBER member FROMLONLAT longitude latitude BYRADIUS radius m|km|ft|mi BYBOX width height m|km|ft|mi ASC|DESC COUNT count ANY WITHCOORD WITHDIST WITHHASH。FROMMEMBER:指 定元素;FROMLONLAT:指定经纬度;BYRADIUS:圆形区域,通过半径 radius 指定半径;BYBOX:长方
11、形区域,通过 width 和 height 指定宽和长,其中 WITHDIST、WITHCOORD、WITHHASH、ASC、DESC 等 命 令 与georadius 的属性值一致。在 Redis 中,地理位置数据通常使用 zset(有序集合)数据结构进行存储,每个地点的经纬度作为成员(member),而分数(score)则可以是任意值,通常为 0,这样就构成了一个有序的地理位置数据集合,而为了支持范围检索,Redis中的地理位置数据集合会构建空间索引,空间索引可以将地理位置数据转换为二维空间坐标系中的点,从而可以利用空间索引的特性进行范围检索,这就是 radis 中 Geo 算法根据一个点
12、的地理位置进行附近点的查询,即可以根据储存在位置集合里的某个地点获取指定范围内的地理位置的集合的原理,Geo 算法其中的 georadius 命令的功能就是实现在指定集合中搜索出某个地点附近范围内符合条件的数据。Redis 中使用 geohash 算法作为范围查询的高效方法,其主要是把地理位置编码成字符串,核心思想是:将地球看成一个二维平面,然后通过递归的方式均分为更小的子模块。当需要对一个地理位置进行 geohash 编码时,首先分别计算出经度和纬度各自的二进制编码,然后按照“从第 0 位开始,偶数位放经度,奇数位放纬度”的规则将经纬度的编码交叉组合,得到一个完整的二进制编码。其次将二进制编
13、码按照五位一组进行划分,分别转化为十进制并对照 base32 编码表对应的值进行转换,最后拼接这些值得到 geohash 值。最后,geohash 需要再次进行解码,通过 Base32 编码表找出每个字符对应的十进制值,然后将十进制转化为二进制,通过二进制计算出对应的区域范围。从而 geohash 达到可以进行范围搜索的功能。例如:一个经纬度为(116.390 705,39.923 201)的地图 1 两点距离示意图中国科技信息 2024 年第 1 期CHINA SCIENCE AND TECHNOLOGY INFORMATION Jan.2024-88-两星推荐点,首 先 转 换 成 二 进
14、 制 为(11010010110001000100,10111000110001111001),其次经纬度编码进行交叉得(11100111010010001111 00000011010101100001),根据对应的规则转换为十进制得(2 829 415 013 111),最后根据 base32 编码表得出编码值为(wx4g0ec1)。实验对比本文先将经纬度计算与 Redis 的 GEO 算法的时间复杂度进行对比。表 1 时间复杂度对比经纬度计算geodistgeoradius时间复杂度O(1)O(log(N)O(N+log(M)表中 N 为指定范围内(由给定位置的半径构成的圆形区域)的元素
15、数量,M 为索引的项目数,O 为时间复杂度。根据上表可以看出数据量少时经纬度计算的时间复杂度与 geodist 语句相比较有优势,但是数据量很多时,由于传统的经纬度计算是通过数学公式来计算两点之间的距离和方向,所以需要大量的数据处理和计算,此时可以看出 geodist 语句更有优势。使用 GEO 算法比直接使用经纬度计算高效许多,而且使用者可以通过使用 Geo 算法中的 geohash 命令来进行快速查找,geohash 命令可以将二维经纬度坐标转换为一维的编码,这样就可以利用有序集合的特性,快速找出某个范围内的位置元素,例如在旅游网站中,可以使用 GEO 算法来实现查找附近的景点或者酒店,让
16、用户可以快速的规划和预定周边的旅行和住宿。在电商、社交平台等生活方面使用 GEO 算法都可以便利用户的生活,但是由于 Redis 中的GEO 算法需要依赖 Redis 数据库,可能需要额外的部署和维护成本。如图 2 中所示,也可以利用 geohash 命令将自己当前的位置信息的经纬度坐标编码成一个由数字和字母组成的字符串。GeoHash 并不能像经纬度一样表示出某个点在地图上的确切位置,表示的是一个区域,这个区域内所有的点都有着相同的 geohash 值。这意味着,geohash 可以表示用户位于某个地点附近,又不至于暴露用户的精确坐标,保护了用户的隐私,例如:一个经纬度为(113.773 5
17、8,34.406 09)的地点,geohash 编码后此地点的区域为ww0gsy。由此也进一步说明了传统经纬度计算结果更精确的优势。GEO 算法可以将复杂的地理数据以直观的图形展示,实现可视化,便于用户理解和分析。很多基于位置的个性化服务都是基于 geohash 实现的,比如附近找房,附近的景点推荐等。以查询附近的景点为例,如果两个地点所在的geohash 值相同,那么可以认为两个景点在空间上是相近的。通过改变 geohash 的长度,表示任意经度的位置:当geohash的长度越短,其表示的精度越低,表示的区域越大;反之,geohash 的长度越长,其表示的精度越高,所表示的区域就越小。因此
18、Geo 算法可以更加及时准确地提供当前的地理信息,故更利于决策者即时做出相关决策,例如在滴滴、Uber 等打车应用中,可以实时更新当前位置附近的情况。场景中还需要计算面数据(即 GIS 中的 POLYGON多边形对象)对应的 GeoHash 编码,需要扩展算法来实现。结束语通过实验对比,发现了经纬度计算与 Redis 的 GEO 算法在地理位置查询方面的性能和适用性。详细分析了两种方法的优缺点,并讨论了它们在实际应用中的适用场景。例如在实际应用中 Redis 的 GEO 算法在查询速度和性能方面优于经纬度计算,可以快速定位和搜索地理位置信息,GEO算法能够更好地处理分布式环境下的地理位置查询,并且具有更好的可扩展性。而经纬度计算在需要精确地理位置信息的场景下更具有优势。未来期待进一步研究和发展更高效、可扩展的地理位置查询算法,以满足日益增长的数据处理需求。图 2 geohash 可视化展示图
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100