1、收稿日期:2022-11-29*中央级公益性科研院所基本科研业务费专项资金项目(2021-9017b)、国家自然科学基金重大项目(U1811463)、国家自然科学基金项目(52072011)、交通运输部公路科学研究所(院)交通强国试点项目(QG2022-2-8-4)资助。第一作者简介:胡松(1992),博士,助理研究员.研究方向:智能交通、交通行为建模.E-mail: 通信作者:翁剑成(1981),博士,教授.研究方向:交通时空信息提取与建模.E-mail:基于关联规则的居民公共交通依赖性致因分析*胡松1杨贝2翁剑成3周伟4(1.交通运输部公路科学研究所北京 100088;2.中路公科(北京)
2、咨询有限公司北京 100088;3.北京工业大学城市建设学部北京 100124;4.中华人民共和国交通运输部北京 100736)摘要:鉴别不同出行者对公共交通的依赖程度,并分析其形成的致因差异,有助于从规划设计、政策制定等维度针对性地改善公共交通服务质量。设计并实施了居民出行的行为调查(revealed preference,RP)线上问卷,在数据质量检验的基础上引入关联匹配技术,通过融合出行调查数据与公共交通出行交易数据实现了个体公共交通出行链提取。提出了公共交通依赖性度量指标与关键致因指标,构建了AGNES-Apriori模型开展公共交通依赖性分级与不同层级群体强关联规则挖掘,并据此提出了
3、公共交通依赖性层级提升的“两阶段”框架及出行激励策略集。结果表明:居民公共交通依赖性可被划分为低、较低、较高和高依赖性4个层级,不同层级对应的强关联规则间具有显著差异性;关联规则包含的指标数量与3个参数值呈负相关关系,高依赖性强关联规则出现的概率为低依赖性的2.1倍;家和目的地到站点总距离、收入、小汽车可用性等客观条件是影响居民公共交通依赖性的关键致因,而公共交通出行低自由度是导致居民公共交通依赖性降低的重要原因;较低的客观条件指标值通常促使居民形成较高的公共交通依赖性;小汽车低可用性变量主要出现在公共交通低、高依赖性群体对应的强关联规则中,而高依赖性群体随其小汽车可用性增强可能出现公共交通依
4、赖性降低的趋势。关键词:城市交通;公共交通依赖性;出行链;AGNES-Apriori算法;关联规则中图分类号:U491.1文献标识码:Adoi:10.3963/j.jssn.1674-4861.2023.03.016A Cause Analysis of Residents Dependence on PublicTransportation Based on Association RulesHU Song1YANG Bei2WENG Jiancheng3ZHOU Wei4(1.Research Institute of Highway Ministry of Transport,Beiji
5、ng 100088,China;2.Zhonglu Gongke(Beijing)Consulting Co.,Ltd.,Beijing 100088,China;3.Faculty of Urban Construction,Beijing University of Technology,Beijing 100124,China;4.Ministry of Transport of the Peoples Republic of China,Beijing 100736,China)Abstract:Identifying the magnitude of travelers depend
6、ence on public transit(PT)and analyzing the differencesin its underlying causes can contribute to targeted improvements in the level of PT services from the perspectives ofplanning,design and policy making.In this study,an online revealed preference(RP)survey for residents travel isdesigned and carr
7、ied out.The data quality is examined,based on which the correlation matching technique is adopt-ed to extract individual PT-trip chains by integrating travel survey data and PT transaction data.Measurement indica-tors and key causation indicators of PT dependence are proposed,and an AGNES-Apriori mo
8、del is developed toclassify travelers PT dependence and strong association rules for different groups.Further,a two-stage frameworkand a set of travel incentive strategies to enhance travelers PT dependence levels are proposed.The results showthat residentsPT dependence can be classified into four c
9、ategories(low,relatively low,relatively high,and highdependences),and significant differences are found among the different categories regarding the strong association基于关联规则的居民公共交通依赖性致因分析胡松杨贝翁剑成周伟147交通信息与安全2023 年3 期第 41卷总 244期0引言近年来,随着我国“公交都市”建设和交通强国战略的不断推进,城市公共交通系统呈现多元化、智能化和绿色化发展。同时,共享出行、网约出行、MaaS等
10、新业态与传统交通模式的融合发展,以及城市居民的出行需求日趋个性化和品质化,导致居民公共交通使用行为及依赖程度具有差异性。因此,从致因角度准确探究居民对公共交通的依赖性,并定量化分析不同出行群体依赖性致因指标间的差异,对于提升公共交通服务质量与吸引力具有重要意义。目前,许多国内外研究学者在居民出行行为方面取得了较多成果。在出行选择行为影响方面,研究聚焦于非集计方法1-2和结构方程模型3-4的使用。姚恩建等5构建双层Nested Logit模型对比分析共享单车出现前后对通勤走廊出行结构的影响。云美萍等6利用非集计分析和统计分析的方法形成混合截面数据,并建立多项Logit模型对比分析2009年与20
11、15年公交服务质量变化对居民出行行为选择影响。杨亚璪等7应用混合Logit模型和潜在类别条件Logit模型对比分析后疫情时代居民特征对不同城市出行方式选择的影响。Arroyo等8建立结构方程模型探究社会经济属性、价值、同行者及态度等多维指标对出行选择行为的影响关系。前期研究多是基于不同因素集测量单类群体出行选择行为的影响效应,缺乏从致因角度挖掘多维指标与多类出行群体行为间的共现性关联关系。关联规则算法是经济学中经典的频繁项集挖掘方法,可从致因角度发掘大规模数据中不同特征或事务间的隐含关系9-10,有助于解决不同群体间出行影响难以差异性对比分析的问题。Yang等11结合“人-车-路-环境-管理”
12、5个方面的因素,利用改进的Apriori算法挖掘高速公路事故风险相关的关联规则,结果表明:事故与工作日、通勤时间、载客小汽车和低伤亡等关联紧密。Yu12结合网络分析和关联规则技术提出了1种多层次的出租车轨迹路径发现方法,探究出租车频繁路径与运动周期。Guo等13在提取轨道交通出行链的基础上利用关联规则算法挖掘不同线路客流的时空关联性与通勤行为特征。王颖志等14针对关联规则分析中传统的兴趣度度量方法和Apriori算法的局限,考虑小概率因子对交通事故的影响,提出了改进的交通事故多发点成因分析方法。许研等15利用地理信息层次聚类和关联规则等方法挖掘分时租赁汽车与网约车2种典型出行场景,并对旅客出行
13、时空特征进行比较分析。Cai16在改进Apriori算法的基础上,定量化探究城市道路事故与时间、外部环境和道路条件间的关联性关系。同样,苏芳等17采用Apriori算法分析星期、时段、道路状况、天气、碰撞类型、涉事车型等客观因素与城市交通事故间的致因关系。但交通方面关联规则挖掘的相关研究大部分聚焦于道路事故风险和客流特性等内容,极少对出行行为表现方面开展研究。因此,研究基于公共交通智能感知大数据和出行调查小数据,通过匹配融合与多层规划理论分别进行个体公共交通出行链提取和出行知识图谱构建,并分别筛选3个公共交通依赖性度量指标和7个依赖性致因指标,结合凝聚嵌套(agglomerative nest
14、-ing,AGNES)层次聚类算法和优化的关联规则算法实现居民公共交通依赖性识别与致因分析。研究有助于深入理解居民公共交通使用行为及其致因差异,为精细化、层次化地提升公共交通系统服务质量与吸引力提供理论支撑。1数据基础研究结合公共交通智能卡交易大数据和出行调查数据,利用匹配融合技术提炼居民的公共交通出行链信息,为公共交通依赖性的关联规则挖掘与提升奠定基础。1.1出行调查数据基于文献分析可知,居民公共交通依赖性受到rules;the number of indicators contained in association rules is negatively correlated with
15、three parameters,andthe probability of strong association rules with high dependence level is 2.1 times higher than that with low depen-dence level;objective factors such as total distance from home and destination to the PT stations,income,and caravailability are identified as key indicators affect
16、ing residents PT dependence,and the low freedom for travelingby PT is an important reason for the reduction of travelers dependence on PT;the low values of the objective fac-tors usually cause the travelers to form a relatively high PT dependence;the low availability of cars mainly relat-ed to the s
17、trong association rules corresponding to the low and high PT dependence groups,while the high depen-dence group may show the tendency of reducing PT dependence with increased car availability.Keywords:urban transport;public transit dependence;trip chains;AGNES-Apriori algorithm;association rules148个
18、体属性、出行特性、出行环境和出行心理等多维因素影响18-19。研究面向北京市居民设计并实施了公共交通出行调查。其中,出行心理因素结合出行行为理论(theory of planned behaviour,TPB)20的态度、主观规范和感知行为控制分别选取公共交通总体满意度、亲友对公共交通使用影响度和公共交通出行自由度3个指标,并采用Likert五分量表测量。主要调查内容见表1。表1主要调查内容Tab.1Main survey content调查维度个体属性出行环境出行特性出行心理调查指标小汽车可用性自行车可用性年龄职业收入教育水平家和目的地到交通站点总距离土地混合利用强度出行目的出行距离出行天数
19、出行次数出行方式公共交通总体满意度亲友对公共交通使用影响度公共交通出行自由度研究于2020年7月在北京市范围内开展常态化条件下居民出行RP线上调查,为减少外部疫情环境对调查分析与模型结果的影响,问卷中已说明应按照非疫情条件下出行环境、行为特征及心理感受等情况填写。最终,共收回初始问卷400余份,通过问卷IP校验和逻辑信息比对等步骤剔除无效问卷,共获取有效调查问卷273份。研究利用SPSS软件的可靠性分析功能获得Cronbachs系数,采用因子分析功能计算KMO检验和Bartlett球型度系数以开展问卷数据质量分析。结果得出,问卷数据的Cron-bachs系数大于0.78,KMO值大于0.80,
20、Sig值为0.00,具体见表2,表明问卷数据质量良好。表2数据质量检验Tab.2Data quality test被检验项出行环境出行特性出行心理Cronbachs系数0.780.810.85KMO值0.800.800.84Sig.0.000.000.001.2公共交通出行链提取公共交通大数据依托北京市公交都市平台获取,数据类型主要为北京市公共交通智能卡交易数据和公交GPS数据等海量异构数据。为了掌握居民的公共交通出行全过程,基于多源公共交通大数据提炼个体出行链。首先,筛选与出行特征相关的数据字段,以公交卡号和首次刷卡时间为关键字段将提炼的公交、轨道数据融合排序;其次,设定换乘时间与空间阈值,
21、获取个体出行链结构;最后,推断出行阶段的起讫点,并以卡号为关键词对融合数据交叉链接以形成个体公共交通出行链。其中,公交标记为“B”,轨道为“R”,换乘为“-”。为充分获取全面、多维的公共交通出行个体特征数据,以出行调查获取的公交卡号为关键字段关联融合涵盖卡号信息的个体公共交通出行链数据,获得大小数据嵌套的个体公共交通出行数据库。个体公共交通出行链嵌套数据示例见表3。表3个体公共交通出行链嵌套数据示例Tab.3Examples of nested data of individual publictransport travel chains数据类型卡号性别年龄/岁职业教育程度收入/元小汽车可用
22、性自行车可用性出行日期出行模式上车线路上车时间上车站点下车线路下车时间下车站点出行距离/m记录信息512*765028男30企业职员硕士及以上8 00115 000比较容易一般2018/7/1B-R668路07:21通州杨庄南口14号线08:22来广营15 2472018/7/1R-B14号线18:42来广营668路19:38新华联锦园14 7522018/7/31R14号线18:30来广营14号线19:05大望路13 9822居民公共交通依赖性建模研究旨在定量分析居民公共交通依赖性与关键致因因素间的关联关系。利用层次聚类算法识别居民公共交通依赖性层级为基于改进Apriori算法的关联规则挖掘
23、提供事务项集,进而实现不同群体公共交通依赖性致因关系探究。2.1依赖性度量指标及辨识模型为了准确提取居民公共交通依赖性的度量指标,基于个体出行链大数据提取居民公共交通出行特性变量:出行天数、出行次数和公共交通往返性,并结合出行调查数据进一步得到居民的公共交通出行天数占比及出行次数占比。其中,出行天数占比、基于关联规则的居民公共交通依赖性致因分析胡松杨贝翁剑成周伟149交通信息与安全2023 年3 期第 41卷总 244期出行次数占比分别为居民采用公共交通出行的天数、次数占总出行的比例,而公共交通往返性指一段时期内居民乘坐公共交通出行并返回的比例。考虑出行天数占比、出行次数占比和公共交通往返性3
24、个特征指标21可有效刻画居民的公共交通使用表现,故将其作为公共交通依赖性度量指标。AGNES层次聚类算法作为广泛应用的聚类算法可有效处理连续型的公共交通依赖性指标数据,同时计算居民公共交通依赖性指标数据间的距离关系以便确定最优分类,故选取该算法进行公共交通依赖性的辨识分析。算法通过计算原始指标数据点间的邻近度创建最底层的聚类子树,考虑对指标数据集中最相近的2个指标数据点迭代合并从而自下而上地生成具有层次的嵌套聚类树,直至全部数据点都处于同1个群组内。为了从整体角度考虑各指标数据集簇间的差异,2个簇的邻近性dave()CiCj的度量选用基于欧式距离的组平均方式10,计算见式(1)。dave()C
25、iCj=|p -q p =1|CipCipq =1|CjqCjq(1)式中:Ci和Cj为不同公共交通依赖性指标数据集;p为Ci样本数据;q为Cj样本数据。2.2依赖性致因指标选取及关联规则算法优化基于出行调查和文献分析可知,当前交通领域中基于关联规则算法的交通指标,以及出行转移相关研究主要聚焦客观条件影响因素,而主观心理因素对居民公共交通依赖性也具有显著影响,但通常忽略了居民出行心理层面的关键致因。因此,结合相关参考文献、计划行为理论范式及前期的研究结果22,从客观条件和主观心理维度分别选取收入(I)、小汽车可用性(C)、家和目的地到站点总距离(D),以及公共交通总体满意度(S)、亲友对公共交
26、通使用影响度(E)、公共交通出行自由度(F)等6个影响效应显著且易于改变的关键致因指标作为关联规则挖掘的基础事务项。为细化探究公共交通依赖性(PT_dependence)关键致因指标与依赖性层级间的关系,需将连续型依赖性致因指标数据进行离散化处理。研究利用较易实现的K-means聚类算法将连续变量分别划分为3类,指标处理结果见表4。Apriori算法是经济学中经典的频繁项集与关联规则挖掘算法,可发现海量数据集中频繁出现的数据集合9,实现从致因角度发掘多维公共交通出行数据项间的隐式特征及关联关系。此外,该算法克服了离散选择等模型不能跨群体定量化对比分析结果差异性的不足,且具有良好的适用性与扩展性
27、。因此,本文选取Apriori 算法作为居民公共交通依赖性致因分析模型,进而从因果角度解析依赖性形成与转移机理。算法思想23主要为通过扫描初始的公共交通依赖性指标数据集C1,累计每个项的计数并确定各项的支持度与置信度阈 值;在 迭 代 计 算 时 为 了 获 取 频 繁k项 集,k=()1234567,需要Ck-1与自身连接产生候选k项集Ck,记作Ck-1Ck-1,再基于参数阈值对Ck进行剪枝,直至频繁项集数达到目标长度结束计算。算法迭代计算流程见图1。开始频繁0项集设定为初始空集C0Cki参数值参数阈值扫描数据集作为候选频繁k项集Ck,k=0,1,2,ni=i+1i m结束是否是否是m,不同
28、项集组合数确定候选频繁k项集参数阈值从Ck中剔除Cki否k nk=k+1图1Apriori算法计算流程图Fig.1Calculationflow chartofApriorialgorithm算法中包含 3 个关键参数指标:支持度(support)、置信度(confidence)和提升度(lift)。其中,支持度参数衡量项集在数据集中的频繁共现度,支持度定义见式(2)。support()AB=()AB|C(2)式中:AB为关联规则表达式;A为规则的前件LHS即关键致因指标项集;B为规则的后件RHS即公共交通依赖性层级;()AB为数据集中指标项A与指标项B共同出现的次数;|C为数据集C中所有指标
29、项总数。置信度指标为B在包含A的事务集中出现的频率,计算见式(3)。confidence()AB=()AB()A(3)150提升度指标表示A项集对B项集出现的影响程度,计算见式(4)。lift()AB=confidence()ABsupport()B(4)若lift1,则挖掘的规则为有效关联规则;若lift1,则为无效关联规则。由于传统Apriori算法在生成候选频繁项集时采用随机组合方法,从而产生规则前件LHS包含依赖性层级指标或后件RHS涵盖关键致因指标等大量不符合预期的关联规则。为靶向限定关联规则前后件中仅包含预期项集,利用R语言中多条件限定函数删除部分不符合实际意义的无效规则并选取满足
30、预期条件的部分规则子集,实现传统Apriori算法的关联规则挖掘逻辑优化,具体的改进算法迭代过程见图2。其中,事务项a,b,c为居民公共交通依赖性关键致因指标,Y为公共交通依赖性层级。初始空集一项集二项集三项集abcYabcYacY bcYabcYcYbabYbcYaabYcaYbacYbrules=apriori(data,parameter)startsubset(rules,subset=RHS(Y)end图2改进的Apriori算法迭代示意图Fig.2Iterationdiagramof theimprovedApriorialgorithm3实证研究基于公共交通出行链数据,计算公共交
31、通依赖性度量指标和关键致因指标并将其输入到上述模型中,在识别居民公共交通依赖性层级的基础上挖掘其强关联规则,为公共交通依赖性提升奠定基础。3.1依赖性层级辨识通过将不同居民的出行天数占比、出行次数占比和公共交通往返性3个度量指标输入到公共交通依赖性辨识模型中,采用样本轮廓系数确定最佳聚类数,经过多次迭代计算获得聚类数为4时轮廓系数最高为0.588,故将最佳聚类数设置为4。此时,裁剪高度的范围为(55,70),聚类阈值参数t=1、聚类树深度depth=2,层次嵌套聚类树结果见图3。高度806040200数据集图3层次嵌套聚类树结果Fig.3Hierarchicallynestedclustert
32、ree表4公共交通依赖性关键致因指标离散化结果Tab.4Discrete results of public transport dependence key causative indicators指标类别客观条件因素主观心理因素关键致因指标家和目的地到站点总距离/min(Distance to transit,D)收入/元(Income,I)小汽车可用性(Car availability,C)公共交通总体满意度(Overall satisfaction,S)亲友对公共交通使用影响度(Influence degree,E)公共交通出行自由度(Freedom degree,F)划分节点D12=
33、14D23=27I12=5 000I23=15 000C12=2C23=4S12=2S23=4E12=2E23=4F12=2F23=4分类比例/%21344531511822651377815136720116920标签D1D2D3I1I2I3C1C2C3S1S2S3E1E2E3F1F2F3分类属性短中长低中高低中高低中高低中高低中高基于关联规则的居民公共交通依赖性致因分析胡松杨贝翁剑成周伟151交通信息与安全2023 年3 期第 41卷总 244期因此,居民的公共交通依赖性层级被识别为低、较低、较高、高 4 个层级,各类簇出行群体占比为14%,31%,23%,32%。最后,将识别的居民个体依
34、赖性层级与其离散化致因指标数据集链接,形成关联规则挖掘初始数据集C1。3.2模型参数阈值确定基于RStudio软件实现2.2节构建的公共交通依赖性关联规则挖掘算法,将初始数据集C1输入到算法中,得到初始1项集共29 620条。为了逐层挖掘不同项集长度的频繁关联规则,通过迭代计算不同参数阈值与项集长度下的频繁规则数量,确定模型参数与关联规则数量间的非线性关系。由图4可见:生成的关联规则支持度基本处于0,0.2范围,而置信度覆盖0,1整个范围。通过控制变量法分别在支持度、置信度为0.01时搜索不同项集长度关联规则的数量,结果见图4。整体来看,关联规则数量与参数值、项集长度存在中心扩散型非线性关系,
35、即参数值越小、项集数越接近中心值3,则提取的关联规则数量越多,而由此点向外扩散所对应的规则数量逐渐减少。以关联规则右件涵盖较多公共交通依赖性等级且获取规则数量明显下降为阈值选定原则,发现当不同长度项集的支持度分别大于0.05,0.05,0.04,0.03,0.02,0.01,置信度大于0.30,0.30,0.40,0.40,0.30,0.35时,居民公共交通依赖性的频繁关联规则数量大幅降低,故选取以上数值分别作为不同长度项集支持度与置信度的参数阈值。此外,考虑提升度值仅在处于1,)时前后件的项集间才存在正向、有效的相关性关系,故取最小值1为提升度阈值。3.3频繁项集挖掘与分析将初始数据集C1输
36、入到优化的Apriori算法中,基于不同长度项集的阈值设定与迭代计算可获取不同群体的公共交通依赖性强关联规则,进而揭示多维度致因指标对公共交通依赖性的联合作用关系。6项集频繁项集为最终挖掘的公共交通依赖性强关联规则,反映了不同公共交通依赖性层级与关键致因指标间的强关联关系,结果见图5。由图5可见:不同公共交通依赖性群体关联的频繁项集具有显著异质性,而低依赖性群体因较为随机的公共交通使用行为特征导致关键致因指标的共现性最低。为了对比分析不同公共交通依赖性层级对应致因指标间的差异,并考虑参数值越大则关联规则的共现性与关联性越高,筛选不同层级关联规则中支持度、置信度等参数值排名最高的前2条关联规则进
37、行研究,见表5。总体而言,由于主客观因素的差异性作用,使得公共交通依赖性关联规则的支持度相对偏低;虽然关联规则1、4的指标共现性一般,但其可信度较高,可作为识别靶向提升公共交通分担率潜在人群的有效依据。公共交通低、高依赖性群体以通学和通勤者为主,其余群体则多为休闲购物者;公共交通低、较低依赖性群体的收入和小汽车可用性呈两极分化现象,公共交通出行自由度偏低,使得群体选择以步行、骑行和小汽车等个体化出行为主,故针对小汽车出行者需提供公共交通系统改善与车辆限制等相关措施激励此类群体向更高的公共交通依赖性等级转移;而公共交通较高、高依赖性群体的收入、小汽车可用性及家和目的地到站点总距离整体偏低,进而影
38、响此类群体更偏好选择公共交通出行,同时需采取多种票价优惠和碳激励等经济手0.200.150.100.050.00支持度6项集5项集4项集3项集2项集1项集6005004003002001000关联规则数量1项集2项集3项集4项集5项集6项集(a)支持度1项集2项集3项集4项集5项集6项集6005004003002001000关联规则数量6项集5项集4项集3项集2项集1项集0.70.60.50.40.30.20.1置信度(b)置信度图4参数与关联规则数量间关系Fig.4Therelationshipsbetweentheparametersandnumberof associationrules
39、152段24-25,以及公交线站优化等策略维持此类人群公共交通出行的积极性。具体而言,家和目的地到站点总距离和收入并未在不同公共交通依赖性等级中表现出规律性特征;小汽车低可用性(C1)分别出现在公共交通低、高依赖性等级中,分别对应了以步行、骑行为主的近距离出行者与以公共交通为主的中远距离出行者,而随着后者的收入和小汽车可用性增加有向公共交通低依赖性转移的风险;而在主观心理层面,仅以学生和退休人员为主的弱势群体感知公共交通出行自由度低(F1),其余关联规则对应的出行群体在公共交通总体满意度、亲友对公共交通使用影响度以及公共交通出行自由度方面均为中等层次,表明在常态化条件下居民对于北京市公共交通系
40、统的使用环境较为认可;同时,从共现性致因角度来看客观条件因素而非主观心理因素为居民公共交通依赖性差异化的关键原因,但主观心理层面仍具有进一步提升的潜力。4依赖性层级提升策略为提升常态化条件下不同出行群体尤其是低和较低依赖性群体的公共交通依赖性层级,研究结合不同依赖性层级强关联规则间指标值差异,提出“两阶段”层级提升框架,见图6。全部依赖性群体低、较低依赖性群体家和目的地到站点总距离收入小汽车可用性低、较低较高高第一阶段第二阶段公共交通依赖性公共交通依赖性公共交通依赖性公共交通出行自由度图6公共交通依赖性“两阶段”层级提升框架Fig.6The“two-stage”hierarchyimprove
41、mentframeworkof publictransportdependence表5不同公共交通依赖性典型关联规则Tab.5Typical association rules of different public transport dependence序号12345678前件 家和目的地到站点总距离=D2,收入=I1,小汽车可用性=C1,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F1 家和目的地到站点总距离=D1,收入=I1,小汽车可用性=C2,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=
42、D1,收入=I2,小汽车可用性=C2,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=D2,收入=I3,小汽车可用性=C3,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=D3,收入=I1,小汽车可用性=C2,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=D2,收入=I2,小汽车可用性=C2,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=D3,收入=I2
43、,小汽车可用性=C2,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 家和目的地到站点总距离=D3,收入=I2,小汽车可用性=C1,公共交通总体满意度=S2,亲友对公共交通使用影响度=E2,公共交通出行自由度=F2 后件公共交通依赖性=低公共交通依赖性=较低公共交通依赖性=较高公共交通依赖性=高支持度0.0180.0110.0230.0190.0340.0150.0420.019置信度1.0000.5000.7500.8330.4290.4000.5000.625提升度7.1083.5542.4662.7401.8481.7251.54711.934图5强关
44、联规则挖掘结果Fig.5Miningresultsof strongassociationrules基于关联规则的居民公共交通依赖性致因分析胡松杨贝翁剑成周伟153交通信息与安全2023 年3 期第 41卷总 244期表6公共交通依赖性层级提升激励政策集Tab.6Incentive policy sets for promoting public transport dependence hierarchy政策维度交通需求管理交通供给管理政策方面交通管制经济惩罚经济奖励交通运行交通运营模式整合具体措施限号出行、限时通行、区域限行、摇号或排号购车、降低核心区停车位规模停车费用增加、特定区域拥堵收
45、费、征收燃油税、提高燃油车购置税“碳普惠”奖励机制、公共交通票价折扣、公交乘车优惠换乘、错峰优惠增设公交专用道、增加公交优先交叉口、设置公交绿波带发展响应公交,BRT,定制公交,接驳公交和轻轨等多服务模式、智慧区域调度优化、车厢拥挤度控制、延时运营、发车间隔优化、智慧信息牌和出行APP等实时信息服务优化、增设地铁站出入口或直通廊道、提升公交线网覆盖率、缩短线路长度、充电桩与场站位置优化、改善乘车环境与设施舒适性优化枢纽站规划与功能、多模式一体化出行整合(如MaaS)、推广TOD发展模式、增加P+R换乘模式范围、公交与地铁衔接优化、加强共享单车、网约车与公共交通接驳合作、多方式付费功能整合政策指
46、标小汽车可用性小汽车可用性、收入收入公共交通出行方便与自由程度家和目的地到交通站点总时间、公共交通出行方便与自由程度家和目的地到交通站点总时间、公共交通出行方便与自由程度针对图6中涉及的公共交通依赖性层级提升政策变量提出“2个维度、6个方面”的激励政策集,即从交通需求管理、交通供给管理2个维度分别提出交通管制、经济惩罚和经济奖励,以及交通运行、交通运营和模式整合等6个方面政策,见表6。通过分析不同城市区域中的公共交通依赖性群体组成,结合激励政策集靶向提出不同组合措施可实现区域级公共交通依赖性精细化提升管理,且不同组合政策具有异质性激励效果。而政策的适用性与效果性因地制宜,未来将会面向不同规模城
47、市开展进一步调查研究。5结束语基于公共交通智能感知大数据和出行调查数据提取个体公共交通出行链,结合3个出行行为表现指标利用AGNES层次聚类算法辨识居民公共交通依赖性,利用优化的Apriori算法进行公共交通依赖性关联规则挖掘分析,最后基于规则指标间的差异提出公共交通依赖性“两阶段”层级提升框架和激励政策集。主要结论如下。1)常态化条件下居民公共交通依赖性被划分为4个层级,即低、较低、较高和高依赖性,改进的Apriori算法可有效挖掘不同依赖性层级对应的强关联规则且规则间具有显著差异。2)公共交通依赖性强关联规则的支持度总体偏低,而置信度和提升度相对较高;其中,挖掘的第1条和第4条强关联规则的
48、置信度参数值最高,可作为部分公共交通低、较低依赖性群体的判别依据。3)家和目的地到站点总距离、收入和小汽车可用性等客观条件因素为影响居民公共交通依赖性的关键致因,可作为居民公共交通依赖性持续提升指标;而公共交通出行自由度为低、较低依赖性群体靶向优化的指标。4)公共交通高依赖性群体中具有小汽车低可用性的出行群体随着收入和小汽车可用性提升有向其他交通方式转移的风险,需采用不同组合激励政策维持。研究面向常态化条件开展公共交通依赖性致因分析,未来应结合不同场景条件进行对比研究;同时,下一步将对公共交通依赖性激励政策的敏感性和有效性进行定量化分析。参考文献References1TU M T,LI W X
49、,ORFIA O,et al.Exploring nonlinear effectsof the built environment on ridesplitting:Evidence fromChengdu J.Transportation Research Part D:Transport andEnvironment,2021(93):102776.2ZHAO X L,YAN X,YU A,et al.Prediction and behavioralanalysis of travel mode choice:A comparison of machinelearning and lo
50、git modelsJ.Travel Behaviour and Society,2020(20):22-35.3LUO M,MA Z L,ZHAO W J,et al.An ex-post evaluation ofthe public acceptance of a license plate-based restriction poli-cy:A case study of Xian,ChinaJ.Transportation ResearchPartA:Policy and Practice,2022(155):259-282.4戢晓峰,杨春丽.欠发达地区高铁出行意愿多群组结构方程模型