1、基金项目甘肃省人文社会科学项目(项目编号:)。作者简介郝斌斌(),男,讲师,主要研究方向:交通系统优化、智能交通研究。基于聚类分析的交叉口状态识别方法郝斌斌吕斌张浩玮(兰州交通大学交通运输学院兰州)摘要:针对城市交叉口交通状态有效识别的问题,建立了三种交叉口交通状态识别方法。结合实际交通流数据,利用模糊聚类传递闭包法、均值聚类算法和模糊均值聚类算法对交叉口交通流周期平均速度、排队长、平均车头时距等向量进行聚类分析,给出适合城市交叉口交通流特点的交通状态划分方法,能够实时、准确、全面地识别城市交叉口的运行状态,为城市交通管理部门交通控制、交通诱导、交通指挥等提供数据基础。定性定量分析的影响,所得
2、结论对城市道路路内停车设施优化具有重要的参考作用。关键词:交通工程;城市交通;交通流状态;均值;模糊均值 ,(,):,:;引言随着社会经济的快速发展和城市化水平的不断提高,全国各大中小城市机动车保有量迅猛增加,城市道路交通问题越来越严重,给城市交通管理部门带来了很大的挑战。交叉口作为城市交通的瓶颈,问题日趋明显,严重影响着城市道路的通畅程度。如果不采取行之有效的管理和疏导措施,城市交通拥堵问题可能由交叉口的点拥堵升级到区域拥堵。交通流数据各指标随时间的变化规律能够反映交叉口实际的交通状态,交叉口交通流状态的分类和准确识别可以为城市交通管理部门交通诱导、交通信号控制、交通应急指挥等提供依据。因此
3、,为了提高交叉口的通行能力,及时进行交通疏导,对城市交叉口每天不同时段的交通状态进行识别监控显得十分重要。随着人工智能和计算机技术的发展,国内外学青海交通科技 第期者提出了很多交通状态识别的方法,等通过比较城市道路和高速公路交通流特点,提出城市主干道交通状态识别的概率事件算法;等提出一种基于浮动车的交通事件监测算法;把模糊数学引入到交通状态的判别中,这种算法消除了传统算法临界阈值决策的问题;郝媛等将模糊系统应用到快速路交通状态的判别,该方法可以动态显示路网的交通拥挤范围;杨祖元等提出城市道路交通状态识别的聚类算法;徐磊提出基于与信息融合的城市道路交通状态识别技术;巫威眺等根据交通流的复杂性特征
4、,提出基于神经网络的交通状态识别方法;陈钊正等利用多变量模糊聚类方法建立高速公路交通流状态实时评估方法。现有文献对于交通状态的识别大多数集中在高速公路、城市快速路上,对于城市道路交叉口的研究较少。现通过对交叉口交通流数据特点的分析,利用模糊聚类传递闭包算法、均值聚类算法、模糊均值聚类算法对交叉口交通流数据从多个指标进行聚类分析,并对三种聚类算法的聚类结果进行分析,找出交叉口交通流状态最优识别算法。聚类分析方法聚类分析方法是一种基于现有数据的无监督学习过程,依据具体样本数据之间的关联度,按照不同度量标准将数据划分成不同类别,使得不同类别之间有较小的相似性,相同类别之间有较大的相似性。聚类算法在大
5、规模数据集的应用上有很大优势,经典算法有模糊聚类传递闭包法、均值聚类算法、模糊均值聚类算法等。模糊聚类传递闭包算法基于传递闭包的模糊聚类分析算法实现步骤如下:()数据标准化。在实际问题中,不同的数据一般有不同量纲。为了使不同量纲也能进行比较,通常需要对数据进行适当变换。通常使用的变换有平移标准差变换、平移极差变换、对数变换等。()建立模糊相似矩阵。设论域,(),依照传统的聚类方法确定相似系数,建立模糊相似矩阵和与的相似程度 ,()。确定 ,()的方法主要是借用传统聚类分析的相似系数法、距离法及其他方法。()聚类(求动态聚类图)。根据标定所得的模糊矩阵,只是一个模糊相似矩阵,不一定具有传递性,即
6、不一定是模糊等价矩阵。为了进行分类,需要将改造成模糊等价矩阵。用二次求法求传递闭包(),()就是所求的模糊等价矩阵,即()。再让由大变小,就可形成动态聚类图。均值聚类算法均值聚类算法()是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。算法实现的步骤如下:()初始化,随机选取个聚类中心(,)。()对每一个数据样本利用公式 (其中,为数据中聚类的数量;为类中点的数量;为第个观察点向量;为类的质心)计算其应该属于的类,并进行标记。()对每一个类利用式 更新计算该类的质心。()计算偏差,收敛判断。如果收敛则结束算法,否
7、则返回步骤()。模糊均值聚类算法模糊均值聚类()算法是从硬聚类算法推广的模糊聚类算法。算法是基于对目标函数的优化基础上的一种数据聚类方法。聚类结果是每一个数据点对聚类中心的隶属程度,该隶属程度用一个数值来表示。算法是一种无监督的模糊聚类方法,在算法实现过程中不需要人为干预。算法实现的步骤如下:()用处于,区间的随机数初始化隶属矩阵,并使其满足,。第期青海交通科技()利用公式 (其中,为数据集的隶属度;为聚类个数;为第个观察点向量,为聚类中心向量)计算个聚类中心,。()利用公式 (其中,为目标函数值;为第个聚类中心与第个数据点之间欧几里得距离;,)?是一个加权指数)计算价值函数。如果它小于某个设
8、定的阈值,或是它相对于上次价值函数的改变量小于某个阈值,则算法停止。()利用公式计算新的隶属矩阵,返回步骤()。交叉口交通状态识别算法评价不同的算法对交通状态的识别存在差异性,为了分析和比较不同算法的识别效果,需要对不同算法的识别结果进行评价。现采用文献的误判率交叉估计评价方法进行评价。误判率交叉口估计方法的基本原理是运用聚类算法对历史交通流数据进行聚类分析后,记录每一个交通流数据的类别归属。然后,从原始聚类分析数据中逐一剔除每个数据,利用剩余数据再次进行聚类分析,并求得聚类中心和隶属度函数。之后用新的判别准则再对剔除的数据做出判别,记录其所属类别。最后利用交叉概率误判比例计算得到误判概率的估
9、计值,误判概率越小表明算法的识别性能越好。交叉口状态模糊识别流程基于模糊聚类分析的交叉口交通状态模糊识别方法流程如图所示,分为离线学习和实时识别两个部分。图交叉口交通状态模糊识别流程 首先,对历史交叉口交通流数据进行模型分析,得到交叉口交通状态的分类模型库。选取合理的交叉口交通流特性(速度、车头时距、停车次数、排队长等)数据,利用聚类算法对历史交通流数据进行分析,结合实际情况对交叉口交通状态进行划分,并获取各个分类情况的聚类中心向量。其次,对采集到的实时交通流数据进行识别。将实时采集得到的交通流数据与上述聚类分析结果联系起来,利用模糊识别的方法,判断实时交通流的所属交通状态。实例分析 交通环境
10、及数据来源数据来源于迈腾数据官网,数据采集地点为山东省济南市经十路与历山路交叉口。时间是从年月日,采集的数据包括交叉口周期平均速度、排队长度、车头时距、实时饱和流率、周期绿灯时长等,单个指标每天采集多条数据。由于该交叉口采用定时控制,周期绿灯时长对于研究交叉口交通流状态没有意义,交叉口实时饱和流率不同时段波动很小,不能反映交叉口交通流状态。因此,选用周期平均速度、排队长、车头时距三个指标研究交叉口交通流状态。对采集到的一周交叉口交通流数据绘图,得到周期平均速度、排队长和车头时距随时间的变化曲线,如图所示。由图可知该交叉口在一周内各交通流数据指标呈现规律性变化,交叉口每天拥堵和青海交通科技 第期
11、通畅时间基本保持在同一时间段内。图 年月日日交通流数据状态分布图 对该交叉口年月日交通流数据各个指标绘图(图)。由图可见该交叉口:(北京时间,下同)由于处在夜间,通过交叉口车辆很少,车头时距很大,车辆排队长和周期平均速度均很小。从:左右开始各交通流数据指标逐渐变大,:左右车辆排队长到达最大值,车头时距变小,周期平均速度降低,此时正是早高峰时期。:左右相比早高峰时间排队长度明显减小,周期平均速度有所提高,处于平峰时段。:左右排队长度逐渐增大,周期平均速度明显提高,:左右各个指标变化平稳,处于下午平峰时段。从:开始周期平均速度明显降低,车辆排队长度达到另一高度直到:左右。从:左右开始排队长呈现明显
12、下降趋势,周期平均速度呈上升趋势,车头时距明显变大,说明此时交通流量正在逐渐降低。图 年月日交通流数据状态分布图 交叉口交通状态聚类分析由于单一的交通流数据指标并不能完全反映交叉口的交通状态,现分别运用模糊聚类传递闭包算法、算法、算法对该交叉口周期平均速度、排队长、车头时距种交通流数据指标进行聚类分析,将交叉口交通流状态划分为除夜间状态(:)之外的种交通状态。其中 算法、算法选取该交叉口年月日:全部数据,由于模糊聚类传递闭包聚类算法的分类结果粗细程度与数据选取量有直接关系,数据选取量越大,分类情况越细,为了能更清楚地展现这种方法的分类结果,模糊聚类传递闭包算法抽取该交叉口年月日:的条数据并依次
13、编号,进行分析。聚类分析结果如图、图和图所示。第期青海交通科技图模糊传递闭包动态聚类图青海交通科技 第期图 算法聚类结果图 算法聚类结果 第期青海交通科技 由图模糊动态聚类图,可根据取值的不同对交通流数据进行不同类别的分类,分类结果清晰明了。但是由于模糊聚类传递闭包算法只针对数据的相似性进行聚类分析,没有考虑数据之间的顺序性,即在聚类分析过程中将整个一天的交通流数据按照相似性聚为一类,没有考虑交通流数据在整个一天中的时段分布情况。因此,模糊聚类传递闭包算法不适用于对交叉口交通流状态的划分。从图和图可见,用 算法和算法对交叉口交通流数据聚类分析结果基本保持一致,将该交叉口:的交通流数据划分为种类
14、别,分别对应种交通状态。为了更好地对比两种算法,对 和两种算法的误判率交叉估计,得到 算法的误判率为,算法的误判率为。其次,从两种算法聚类分析结果中可见同一类别不同指标之间还存在重合(例如:算法聚类结果中:在周期平均速度聚类结果中划分为类别,但在排队长聚类分析结果中则划分为类别),重合时段统计如图所示,从图中可以清楚看到算法的重合时段明显小于 算法。这是因为算法对交叉口交通状态的划分具有模糊性,而 算法是一种硬聚类算法,把每个待识别对象严格地划分到某类中,具有非此即彼的性质。算法在开始时需要给定一个初始聚类中心,这个初始聚类中心的选择会对聚类结果产生较大影响,一旦初始值给定不好,可能无法得到有
15、效的聚类结果。算法误判率低于 算法,算法运用了模糊划分和模糊划分相适应的隶属矩阵方法,建立了样本对类别的不确定描述,在一定程度上克服了 算法的不足。因此,对交叉口交通状态的划分,算法具有更好的适用性。图两种算法不同类别重合时段统计图结论现以城市交叉口交通状态为研究对象,采用交叉口交通流数据的多个指标作为数据来源,建立了交叉口交通状态的种识别方法。通过实例验证分析,发现算法的识别方法更加适合交叉口交通状态的识别,识别结果和实际情况基本保持一致。该方法与传统采用交通参数阈值的方法相比,更加合理、有效。文中对于交叉口的交通状态通过算法的分析,划分为个状态,在实际应用中可以根据实际交叉口具体情况合理调
16、整其划分状态的类别,以增强其实用性。参考文献 ,():,():(下转第页)青海交通科技 第期资源化利用分类规范:北京:中国电力出版社,河南建筑材料研究设计院有限公司硅酸盐建筑制品用粉煤灰:北京:中国建筑工业出版社,长江水利委员会长江科学院水工混凝土掺用粉煤灰技术规范:北京:中国电力出版社,:,:,:,:,:():,:,(),櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺櫺(上接第页):,():郝媛,徐天东,孙立军基于模糊的城市快速路交通流状态判别公路工程,():杨祖元,黄席樾,杜长海,等基于聚类的城市交通拥堵判别研究计算机应用研究,():徐磊城市道路
17、交通状态判别与预测系统设计与关键技术长春:吉林大学,巫威眺,靳文舟,林培群基于神经网络的道路交通状态判别方法研究交通信息与安全,():陈钊正,吴聪多变量聚类分析的高速公路交通流状态实时评估交通运输系统工程与信息,():谢季坚,刘承平模糊数学方法及其应用武汉:华中科技大学出版社,顾超然基于模糊均值的城市道路交通状态判别研究北京:北京交通大学,姜桂艳,郭海锋,吴超腾基于感应线圈数据的城市道路交通状态判别方法吉林大学学报(工学版),():何清模糊聚类分析理论与应用研究进展模糊系统与数学,():王熙照,王丽娟,王利伟传递闭包聚类中的模糊性分析计算机工程与应用,():胡建荣,何磊基于尖点突变理论的高速公路交通流状态判别方法中国公路学报,():蔡晓禹,蔡明基于山地城市快速路交通状态判别方法研究公路,():殷俊杰,丁宏飞,薄雾,等基于模糊聚类的城市快速路交通流状态划分重庆交通大学学报(自然科学版),():董斌城市快速路交通状态转变时刻确定方法研究公路交通科技,():杨庆芳,张彪,韩振波,等冰雪天气下的区域交通状态实时判别吉林大学学报(工学版),():青海交通科技 第期