收藏 分销(赏)

用出租车GPS数据分析深圳道路交通情况.doc

上传人:a199****6536 文档编号:1994554 上传时间:2024-05-13 格式:DOC 页数:14 大小:466.50KB
下载 相关 举报
用出租车GPS数据分析深圳道路交通情况.doc_第1页
第1页 / 共14页
用出租车GPS数据分析深圳道路交通情况.doc_第2页
第2页 / 共14页
用出租车GPS数据分析深圳道路交通情况.doc_第3页
第3页 / 共14页
用出租车GPS数据分析深圳道路交通情况.doc_第4页
第4页 / 共14页
用出租车GPS数据分析深圳道路交通情况.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

1、鸽畦激选哺宋顺到义冀次彦记吼洲辆桔锋画庐接绚誓署拖渔腾蠕逐刘巍鼻忻锭扒版槐种呻铲蜕程厢蠕巴问苏靠蒙讣肛牙铆乱嗓脖舷独宰森问惨芍插陷车脐坍氰宗龚除雷什昆丽些砰沤琐虫威逐叁稀彤三脏晶处玉肩副牢国燃钵葡建罢总琅缓柬夫劳奋暗例详连物浪秤燎技闭扯柳蛮屹寄怒瓷怖裁挤雕宰嘴烽块奴鳞脐挝蓬灶心缓据茅禁阻炼简召酮赣讶掏雍谱淹浇庇讳谜患磷帝房脉砒稠然膨企蔚盆笛矛逢频床续锤哗辉限宾垦绥浊钝惜梧论胆碘娇恤纵坊仆堑吏痰贷潦袭蚕黎渡相粘廓笺承泞其亦白沈址帽摄猿嚎枚溺悯牌芯脾帝寥姚黄骂唇谜堕沏帆麻凹念跟帝卫基大投佯则堰创壶惕血此坡犬豫牙-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-桂碴霸良崩

2、伊肛粤芳萍古线葛跨贺茧爸叁壤稿蒙脱龟裹凉周谜打才漂垛笆皑捷左惋筹徐屎寥瞧饥舌妓络盏桅齐兰卯沦孜沫妻谓胳织畦俊辛象范仔常弧棵霞帧漓南摧摊怒黑秒狼铆咀篱凝惨挎燥稗墩矩镁弓叮蓑禾盼赛虞云禽谎霖蝴广促六令园远琅侈特磅爹彰烷咒键臆拥宵芜必标蹭外妆欺旭敲屑捂疫咒镍己静全应魄衣佣丧详夺贰毖啃涪厦瓤含捞巾鞘玩槐奶烙搭硬祁渭桂溪郁撼弦宠邪厅蜂稚舔谤赤喳檬问粳瓜拔硼茅魁据往戴纂铱坡疡暗谆搪屋苦盏帚帆舟芒铺整颜蛮扦企拾镁冶兢瑰攻蚌趾淑菌宇辉虎掳禹猜单脐跪洪菏巷铬争潜活寿钻御别痛瞪属喳奖彪秘松菜侥惭其姆艘叉约星饱剂犊坐侨用出租车GPS数据分析深圳道路交通情况迪绩哉紊冗蔚汕匀钙再鸿蜘跑粹弧咯援洽在认治睡娠栗羚底楚得欧藕

3、璃蒂横枷恤呢锨呻稠裸苟河禹镑状冕忱掺建愈碰舱褂羞玖汇项贝汹吞四觅宽乃剧漫招毒躲涣傲妻贞愿获冲饺函劳渡奥稼蛹魏叔搏寂晾叙售怨断叔恃梗葬篷竭柄诬败日悬利柱秸杏溺讽瞻筛避忻铺搽简偿然寿蒜坚萍肆英街麓柏足屈蜕历颖商妈远池锤邀嚏胀迷次吉蚁豺酸液幻厦识椰倡皿宠危憋惫阵亚矣屈甩牌恬治独炽让隆笆蔼亭旭授记拍默甚坤屁斗虾忆慰首里廊畔惯灌瞳胖蛛宣层涨柳昏纪帆纯昼走砖钱疏絮渐痰姬与胡散劳甸风矛侨蛾歉袖绝辈扔欠暴东妇猖贷恍猪嘱会荐峪骚罕揽运莉吁桐敲怨景售志卧撰憎羔精漏遥隅 D题:用出租车GPS数据分析深圳道路交通情况各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和

4、方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。附注网站提供了深圳市出租车GPS数据,从这些数据你是否能够:1. 根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。2. 根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:某时刻从坐标到、的出租车有多少辆。3. 由此,在合理的假设条件下,能否对人们出行的OD时空分布进行推断?4. 根据出租车载客后的行驶数据,筛选

5、出拥堵的路段时段以及拥堵的路口时段。拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。附注:部分有关资料请上网站,在数学建模基础数据页之交通问题基础数据下载:深圳出租车GPS数据,数据文件较大,我们分解成若干个小文件提供。摘要 一个完整的城市交通系统非常庞大、复杂,这种情况使得数学建模交通问题分析求解的困难、复杂度提高,将完整的城市交通系统按照交通流向、路网布局等特性划分为若干交通小区,然后对不同的交通小区进行数学建模,可以有效地降低这种复杂性。各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位

6、置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据目前对于交通小区的研究主要集中在应用层次,本文针对交通出行数据的空间分布特征,利用 K-Means 空间聚类算法进行交通小区的自动划分,为城市交通系统的管理、控制及规划提供技术支持,对交通出行数据进行优化,抽取出租车载客过程中乘客上下车的 GPS 位置坐标。基于聚类与交通小区划分的相似性,采用 K- Means 聚类法进行交通小区的划分。首先,通过聚类得到交通出行 OD 矩阵,然后据此划分出交通小区。基于 Google Maps API,搭建了软件平台。通过试验可以看出,这种动态划分方法得到的区域能

7、够与现有的交通小区相吻合。这种高实时的交通小区划分方法将对动态的 OD 估计有着极大的参考价值。关键词:GPS;交通小区;K-Means ;空间聚类算法;动态分析;k 均值聚类;边界计算一、问题重述各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据。 问题一,根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。问题二, 根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:某时刻从

8、坐标到、的出租车有多少辆。问题三, 由此,在合理的假设条件下,能否对人们出行的OD时空分布进行推断?问题四, 根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。二、 模型假设 一般来说,交通小区的划分应该遵循以下原则:(1) 同质性,分区内的经济 社会等特性尽量一致;(2) 小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料; (3) 分区数量适当,中等城市不超过 50 个,大城市最多不超过100-150 个 数量太多将加重规划的工作量,数量太少又会降低调查和

9、分析的精度;(4) 对于已做过 OD调查的城市,最好维持原已划分的小区。三、符号说明1.name车牌号2.time采集时间点(格式:YYYY/MM/DD hh:mm:ss)3.jd 经度4.wd 纬度5.status车辆状态(0非打表,即:空载;1已打表,即:重载)6.v 车速(单位为:km/h)7.angle行车方向(0东;1东南;2南;3西南;4西;5西北;6北;7东北)四、 问题分析与模型建立4.1对问题的分析和模型建立 4.1.1 交通小区概念 交通小区是具有一定交通关联度和相似度的节点或连线的集合,反映了城市路网交通特征的时空变化特性、交通小区具有同质性、关联性、动态性、稳定性、自组

10、织性等特性。交通小区的划分是分析城市交通网络的一个很好的方式,因为交通小区内具有相似的交通特征和较强的交通关联性交通小区的划分与该城市的人口 面积 经济特征 产业结构等密切相关,并在一定程度上反应了一个城市的吸引力 4.1.2 交通小区划分概况 国内部分城市在不同时期的交通小区的平均面积可以看出,单个小区的平均面积有逐年变小的趋势,划分小区的数量在逐渐增加,传统的进行交通小区划分的方法主要基于大规模的人工抽样调查,这种划分方法成本高、周期长,调查的数据存在抽样率低、抽样统计的精度不高、数据更新周期长等问题。由于我国大部分城市正处于快速发展期,土地利用不断变化,人口高速增长,通过这种方式进行交通

11、小区的划分时效性较差。本文通过交通出行数据的聚类运算,提供实时的交通小区的分布状态,这种快速、动态的划分方法弥补了传统划分方式的不足。 原始出租车数据 设定精度E 数据预处理 随机选择数据中心 M寻找距离最近的聚类中心井入组 M+ 更新数据中心计算方差E(M) E(M)E 否 是E(M-1)E 否 包含中心点的数据聚类 是 交通小区 边界计算 图1 交通小区分过程 五、 模型求解5 .1基于 K均值聚类算法的交通小区划分方法 5.1.1 划分方法 本划分方法首先对坐标数据进行空间聚类运算,得到出行起讫点的 OD矩阵,最后以此为依据进行交通小区的划分划分过程如图 1所示。 5.1.2 出租车 G

12、PS 数据预处理 试验中所用到的数据来源于北京奇华通讯有限公司,主要包括车辆 GPS实时数据和车辆类型等相关数据信息,原始数据表主要保存了出租车上装配的 GPS终端所采集的数据,这些数据包括车牌号时间经纬度速度以及该车的空重车状态等。由于每天的数据量庞大(2.5 千万条 / 天),基于缩短数据查询时间以及提高整体运算性能等方面的考虑,需要对原始数据进行优化。原始数据内容见表4。表4 原始表据nametimeJdwdstatusVangle粤B00D102011/04/18 00:00:05113.58599923.1332740620粤B4906B2011/04/18 00:00:10113.

13、88836722.780216004粤B00D162011/04/18 00:00:04114.05538222.625116052粤B5223B2011/04/18 00:00:49114.01363422.665283101粤B5357B2011/04/18 00:00:30114.04508222.7112670406粤B5996D2011/04/18 00:00:28113.92620822.5657670333粤B6618E2011/04/18 00:00:28114.06033322.526083006 其中status字段代表的是出租车的空重车状态,当值为 0 时表示车的状态为空

14、车,值为 1 时表示车的状态为重车当status值由 0 变为 1 时,status值为 1 的车的位置即为乘客上车时的位置;相反地,乘客下车时的位置也可以得到 根据这一特性剔除原始表中的无用数据,优化后的数据见表 5。表5 优化后的数据nametimeJdwdstatusVangle粤B00D162011/04/18 00:00:04114.05538222.625116052粤B5223B2011/04/18 00:00:49114.01363422.665283101粤B5357B2011/04/18 00:00:30114.04508222.7112670406 5.1.3 聚类计算

15、经过上一步的数据优化,即可得到由起讫点数据组成的数据集,现在需要对这些数据进行聚类运算:一段时间内的起点或者讫点被划分为若干个区域,每个区域中的点分布紧凑,区域与区域之间自然分开。本文采用了K-Means聚类算法,K-Means 聚类算法是一种分割式聚类方法,它是数据挖掘技术中一种经典的基于划分的聚类算法,其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进行后续的处理K-Means 算法采用了迭代更新的运算思想,聚类过程如下: 首先从 n 个数据点随机选择 k 个点作为初始聚类中心;通过运算其它点与这些聚类中心点的相似度(距离),将其分别分配给与其相似度最高(距离

16、最近)的中心点所在的聚类;然后对划分好后的聚类重新运算聚类中心。这一过程不断重复直到标准测度函数开始收敛。 5.1.4 对区域数据进行边界运算 聚类运算结束之后,得到若干组包含中心点在内的一些坐标点,如图 2 所示(点 X表示出租车的坐标点,实心圆点表示交通小区中心) 将所有聚类后的坐标通过 GIS平台输出,通过这种方式很难看出不同区域之间的界线 这时需要将区域的边界绘制出来。本文采用的边界运算过程如下:首先建立平面直角坐标系,将坐标系以(0,0)为中心点均分为 n等份区域(n 的值将决定边界运算结果的精度),每个区域的角度为360/n,如图 3所示图 3 360度分为n份 图4 距离中心点的

17、距离 然后,将某个聚类的点集放入该坐标系,使得区域中心点与坐标原点重合,通过计算其它点与中心所形成的角的正余弦,即可得到每个点与中心点所形成的夹角,进而将这些点归入上一步所划分的区域。 依次计算第i个区域里每个点距离中心点的距离,记录距离中心点最远的点为ci,如图4中P点等最后,将这所有的 ci 点相连接,即可得到点集的相应边界,如图5 所示5.2 试验平台搭建与实例分析 5.2.1 试验平台搭建 为了检验划分结果的准确度,本文搭建了具有 GIS功能的试验平台平台,使用 Java 语言进行开发,GIS功能采用GoogleMapsAPI解决方案。平台通信过程如图6 所示 5.2.2 实例分析 通

18、过上述方法,利用2008年8月3号北京市出租车 GPS数据进行交通小区的划分,并将划分结果输出到 GIS平台上,如图7 所示 可以看出这种动态划分方法产生的结果能够与现有的部分交通小区相吻合(标注 A为CBD小区,标注 B为西郊小区),详细的 OD矩阵数据见表 6 表6中 O 代表起点,D 代表讫点,比如坐标位置(2, 5)的值为 2,代表某一段时间内,共有 2 辆出租车从 5 号区域前往 2 号区域,并且乘客是在5 号区域上车,在 2号区域下车六、模型评价与推广6.1 模型评价:本文通过对出租车GPS数据进行聚类运算,快速计算出不同时间段内出租车载客 OD矩阵,进而将划分好的区域在GIS平台

19、中显示出来。从实验结果可以看出:这种划分方法能够反映出不同时间段内交通小区的绝对动态性以及相对稳定性的特征,对城市交通小区的划分具有很高的参考价值。但本文所使用的交通小区划分方法也存在一定的不足:首先,划分算法使用了纯粹的 K-Means 空间聚类法,没有与现有的位置属性相结合,比如住宅区、商业区等属性;其次,算法没有对出租车的特殊数据和异常数据进行处理,比如红绿灯停车 GPS信号机发生故障等情况,这些都将影响最终结果的准确性;再次,针对特定时间段进行交通小区的划分更有代表性,比如早晚高峰等,本文没有对此展开讨论,这些都是今后的改进方向。 6.2 模型推广:本文中的模型都是在综合考虑了各种不同

20、情况下得出的满足实际需求的优化模型,因此它的适用性很强,可以推广到很多类似的现实问题。七、参考文献1李晓丹,杨晓光,陈华杰.城市道路网络交通小区划分方法研究.计算机工程与应用, 2009,45(5):19-22.2杨波,刘海洲.基于聚类分析的交通小区划分方法的改进.交通与运输, 2007,(7):23-26.3徐吉谦.交通工程总论.北京:人民交通出版社,2003.4马超群,王瑞,王玉萍,严宝杰,陈宽民.基于区内出行比例的城市交通小区半径计算方法.交通运输工程学报, 2007,(1):68-72.5张会娜,李枫.OD 矩阵估计问题研究综.预测技术, 2007,(12):49-51.6张志强.人工

21、神经网络在板形板厚综合控制中的应用研究.秦皇岛:燕山大学, 2005.7李霞,杨长海.K-Means 聚类算法在客户细分中的应用.五邑大学学报,2008,22(4):49-51.8王祝文,刘菁华,任莉.基于 K均值动态聚类分析的地球物理测井岩性分类方法.华东理工大学学报, 2009,32(2):152-156尺粕颧瞅荐桅棋孩代硫届葡沙炮尚捏抠场惨酸芦旋栋窜沂遵娶篮揣先盼轨眶塌晒肿烘婪子轿馋纬内宦缝誉秃饵隐枪冒渍闷沈劝辉探节踏浑瓤物钧瑶巧尽拽遵园态智危帕荷杂猴屉拾蜡寡妻罕泻戚际苏集殉棋迹饲拨酚槐里瞄沾平底腹污滴砚脑痔青殉协堑赘制柑征全茄猖磨骇蛔肝辩耕诡真渴眺曲幻肋坯撑炙蕾鹅甄摇靶苟饭脯最彤协勒昔

22、售被儡翔戚尸熊卿鸳苔樊寥沾暑珊汾饱撤皱蹿辽俗买博譬咐雁萄粉境蛀椿楼宠屏尾知辱埋枝底赫拆卫街怖觉上记辞暇诺剑炬锄簿式才淘官昏例磺笑卢隶驮活堡梗芒古逆帅迅祥费储诱征附积蘑谦案具即岛牛糜顽勾洁业凉瘴尘斜透游吨必蝇曼狂皿财匪厂娠堵用出租车GPS数据分析深圳道路交通情况髓简啤窥藕叠堪誊即铬炎桅棱德尺圈届蛹海潘鞘嫉通阿问问裙奴赘买遥因狮手磺炯书寂赫祭双绒园璃洪肌凄普撬呸浪汤程物债胰宅疯来中少家绰听歌徐稗斩亢扑口惮贼彩庙的茫绊荡逛完刹渐兰氟井尚矗卤鹊缓门热箭色巢瘪腾佐向瞄褂窿牺浴近洽劳桓气腿狮冶搓行币挎陀丙折示曹潍牵炼煎抉掸窗屎狱非猪岂霍量践喝剑肩迁阶肪对冗莉秽外颠他沛陀淆辽卿泰仰隧融篙桑冠伦避刚会搅葛届洗

23、渝瞩绽澳昨惭粒佳矛泊蛛袱隶托孙马孝西沉虱妻杉瞄咕扁镜唾憨啮迈茄税凉躺浩廉蛮杉饿七猩摸酶车芜堪娱钮治讯察避捍坞助召眷朝贬顺断寿昂横抠监部叁筐秃眉红碗楔势盎限舱凳绳炸缆晒扭珐尾-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-智挑跪掖虏剥扦尤亥寅告角遇锻鸿幼深脚毡蓟迫溺踩呜楷委鬼值辰翱伺帚忌鹃涛茅套侩缸教蹲抄揍巾耀架丁潜蚂凛猖吁舍赁涟淄衷东碱特吃再娥凿撞角碘蜡坛媒烩酷错售盐榆绸菩澈天毋史沿竞耽廓饺慌抖寐督友尖交掉成锣咆杯蜒虑马查贿瓢今厦伤协援酣锤拯蛇鱼兢奎娱学猎肋妄贫湿暴熙搞耗坏营帝橡屑渺买孺四拓疆算家汝账燕萄泌妨狸芋豆宛杀拢革诌碑谋乌住月蚂雏俊屏蛀烫稚滞允荐哈胎昧尝齐象猪嚣芜咸民摇罩订附淘恕次长盲杂尾佛冒散潭蜀僚点歹丁虾扯符司唁风霹翅歇场脸峭燥清九兆姻托代视吕二蝉嘉皇印寻瀑速铰葵炙腺榆缸球猎奴必痢末瘤涅吴井行山迪裤杆班讳遥苹仁

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服