基于支持向量机的地铁故障类型预测_张仪鹏.pdf

资源描述

1、文章编号：1673-0291（2023）01-0090-08DOI：10.11860/j.issn.1673-0291.20210093第 47 卷第 1 期2023 年 2 月Vol.47 No.1Feb.2023北京交通大学学报JOURNAL OF BEIJING JIAOTONG UNIVERSITY基于支持向量机的地铁故障类型预测张仪鹏，周玮腾，韩宝明（北京交通大学交通运输学院,北京 100044）摘要：针对城市轨道交通运营压力增大带来的故障隐患和诸多问题，基于城市轨道交通故障隐患数据，构建支持向量机实验预测模型，将筛选处理后的数据与模型相结合，探究未来一定时间段内城市轨道交通可能

2、发生故障的概率和类型，在不同维度、数据量的情况下，对模型运算的效果进行分析，找出其对模型准确率的影响，确定最佳数据维度和使用数据量，为运营公司应对突发故障提供决策辅助方法.以现有数据通过支持向量机模型进行概率预测估计，同时加入噪声数据测试对模型准确率的影响，最后与 BP 神经网络模型和极限学习机方法进行对比.研究结果表明：本文构建的模型进行地铁故障概率预测的准确率能够保持在 60%左右，说明具有一定的可行性，同时能够在含有噪声数据的情况下进行故障发生概率预测.关键词：城市轨道交通；故障预测；机器学习；支持向量机中图分类号：U121 文献标志码：ASubway fault type predic

3、tion based on support vector machineZHANG Yipeng,ZHOU Weiteng,HAN Baoming（School of Traffic and Transportation,Beijing Jiaotong University,Beijing 100044,China）Abstract:In view of the potential failures and many problems caused by the increasing operation pressure of urban rail transit,this paper bu

4、ilds an experimental prediction model of support vector machine based on the potential failure data of urban rail transit.The filtered and processed data is combined with the model to explore the future probability and types of possible failures in urban rail transit during a period of time.The effe

5、ct of model operation is analyzed under different dimensions and data volumes to identify its impact on the accuracy of the model,determine the best data dimension and the amount of data used,thus providing decision-making methods for operating companies to deal with sudden failures.The existing dat

6、a are used to estimate the probability prediction by the support vector machine model.At the same time,the noise data are added to test the impact on the accuracy of the model.Finally,it is compared with the BP Neural Network model and the Extreme Learning Machine method.The research results show th

7、at The accuracy of the model built in this paper for subway fault probability prediction can be maintained at about 60%,which shows that it is feasible，and can predict the failure probability with noise data.Keywords:urban rail transit；fault prediction；machine learning；support vector machine收稿日期：202

8、1-06-30；修回日期：2022-01-07基金项目：中央高校基本科研业务费专项资金（2022JBMC057）；北京市自然科学基金（L201013）；交控科技设计创新和学科发展基金（9907006511）Foundation items:Fundamental Research Funds for the Central Universities（2022JBMC057）；Beijing Municipal Natural Science Foundation（L201013）；Design Innovation and Discipline Development of Traffic C

9、ontrol Science and Technology（9907006511）第一作者：张仪鹏（1997），男，河南郑州人，硕士.研究方向为交通运输工程.email：.引用格式：张仪鹏，周玮腾，韩宝明.基于支持向量机的地铁故障类型预测 J.北京交通大学学报，2023，47（1）：90-97.ZHANG Yipeng，ZHOU Weiteng，HAN Baoming.Subway fault type prediction based on support vector machine J.Journal of Beijing Jiaotong University，2023，47（1）：9

10、0-97.（in Chinese）张仪鹏等：基于支持向量机的地铁故障类型预测第 1 期近年来，城市轨道交通发展迅速，逐渐成为一种兼具舒适性和时效性的公共交通方式，方便人们的出行，提高人们的生活水平，同时成为许多大城市解决交通拥堵问题不可或缺的手段1.然而，随着城市轨道交通各种相关设备设施使用频率不断增加，导致设备设施出现故障情况的次数也在不断增加.当信号故障、屏蔽门故障等发生时，会带来更严重的安全问题，影响到乘客出行2.故障预测通过一定的方法提前预知故障的发生，对相关设备在故障发生前进行检修或维护，启动相对应的应急预案，解决可能带来的乘客拥挤问题和安全问题，这在维护城市轨道交通正常运营方面显得

11、尤为重要.随着城市轨道交通网络复杂化程度逐渐提高，越来越多的专家学者认识到相关故障分析预测的重要性.近年来单层决策树和 AdaBoost 多分类算法3、模糊理论4等方法已经运用到对车辆的制动故障和轴流风机故障的诊断之中，结果表明这两种诊断方法是可行的.同时故障分析系统5、检测与智能化诊断系统6、基于熵权的模糊层次分析法7等方法已经应用到城市轨道交通故障的预测和诊断之中，优化车辆设备的检修时间，提高城市轨道交通服务水平.既有方法虽然具有一定可行性，但仍存在着模型算法复杂、运行时间较长、准确率难以保证等问题.随着大数据的发展，部分人工智能的新方法逐渐被用于一些故障和突发事件

12、的分析预测之中，以机器学习为代表的多种人工智能方法在突发故障的预测中已经取得效果.三层 SVM 的分类模型8、基于 LM 算法的 BP 神经网络和极限学习机9方法在事故中展现出了较高的预测精度.Bagging 分类器、DecisionTree、RandomForest 和全连接神经网络10的应用对于低频偶发事件有较高的预测精度.李涛等11研究基于 LM 算法的 BP 神经网络和极限学习机建立交通事故严重程度的预测模型，结论为两种方法对于严重程度这种难以量化的效果预测能够保持一定的准确率.Pang 等12对 Maximum Entropy、Naive Bayes、SVM 3种方法的分类效果分别进

13、行实验后比较，结果表明 SVM 分类效果是最优的.Whitelaw 等13在对情感文本进行一定处理的基础上，提取含有不同属性的形容词词语作为特征向量，后利用 SVM 分类器对正、负文本进行了分类.Ye等14以旅行博客的文本评论为例，使用朴素贝叶斯、支持向量机和 N-gram 模型方法进行了对比研究，结果显示支持向量机的准确率要高于 N-gram 模型和朴素贝叶斯算法.虽然支持向量机在部分故障隐患领域已经有所进展，但将其运用在对于城市轨道交通故障预测及分析的研究还相对较少，主要因为城市轨道交通相关故障数据较难获取.本文根据相关运营公司提供的官方数据，结合上述研究的理论和

14、出现的问题，通过建立支持向量机预测模型，分析不同数据维度、数据量下的预测结果，并与神经网络极限学习机方法做出对比，验证支持向量机预测的有效性，为城市轨道交通故障预测提供了一种较为科学合理的思路.1 地铁故障类型预测模型的构建由于地铁故障的预测属于低频偶发事件预测范畴，而且受影响因素众多，难以逐个建立各因素间的关联关系和相关分析，常规的回归分类、时间序列模型等无法准确合理地对故障发生概率进行估计，因此本文在模型构建时主要考虑基于支持向量机（Support Vector Machine，SVM）的建模方法.地铁故障类型预测模型流程图如图 1 所示.首先对收集到的某地铁有关故障数据按照模型的要求进行

15、编码和处理，使得数据能够被准确地利用，然后在寻找最佳参数的基础上，采用构建的模型进行学习训练，最后利用测试集的方法对模型准确率进行评估.1.1 SVM 模型建模方法支持向量机模型的基本思想示意如图 2 所示.图 2（a）中，蓝色和黑色圆形分别代表地铁故障类型1和 2，红色圆形代表将其分类的间隔点.图 2（b）中，同类型的数据样本将形成分类面H，即H1和H2，分别为与分类面最近的样本点相切且平行于分类面的平面，其间距为分类间隔.所谓最优分类面就是要图 1预测模型流程图Fig.1Flow chart of prediction model91北京交通大学学报第 47 卷求分类面不仅能将两类事故类型

16、完全正确地分开（训练错误率为 0），而且使分类间隔最大，从而当数据进一步增多时，出现错误的概率最低，这是保证错误最小化原则的具体实现.如果将其推广到更多故障类型中的分类空间，最优分类面就成为最优超平面.在空间中，城市轨道交通故障类型较多，因此多个类型故障数据需要划分，如果可以无误差地将其划分，并且每一类故障类型数据的分割超平面距离最近的向量与超平面之间的距离最大，则这个平面被称为这次分类的最优超平面.在分类的过程中，首先需要对故障的种类进行划分，进而根据各故障种类样本形成对应的分割超平面，在分割超平面基础上进行进一步计算得到超平面的间隔，根据多个超平面的间隔比较来选取最优超平面，其相对于每个分

17、割超平面距离都较大.但有时不能够满足分类的错误率为 0，这时需要特定的参数对模型进行进一步优化计算，具体模型运算包含 5个步骤.步骤 1：针对一个数据样本集合S，其中有两种故障类型，为了得到最优超平面H（yi=1），yi对应的是不同种故障的标识，代表选取的两种不同的故障类型集合，需要根据H1和H2来计算与H之间的空间距离M，当空间距离M最大时，即能确定此时的H为最优超平面.根据计算设定第 1种故障类型的分割超平面H1满足xi+b 1yi=1 （1）第 2种故障类型的分割超平面H2满足xi+b -1yi=-1 （2）用线性函数可总结表示为：y=(xi+b).式中：为权值向量，决定着选取的多个影响

18、故障发生变量的比重；b为偏置，决定了数据的总体范围；x为输入量，将选取的与故障相关特征量数据处理后进行输入计算.步骤 2：超平面方程xi+b=0，xi为计算时向量乘法得到的内积.通过计算可知，此时相应的两条直线间的距离为M=1/，即为超平面的间隔.所以两类分类问题的最大间隔就是使得最小即可，为了方便之后计算，可以将问题转换成求得0.52最小，将对预测错误结果能够容忍的程度 C 作为惩罚系数代入模型计算后，此时模型计算可转化为Mmax=min：0.52+Ci=1nii 0，i=1，2，n（3）惩罚系数 C表示对预测城市轨道交通故障产生误差所能容忍的程度.C 越高，说明越不能容忍误差的出现，模型计

19、算的复杂程度会增大，运算时间也会增加；C 越小，则对于分类出现错误越能够容忍，模型计算相对变得简单.步骤 3：在实际问题中，故障包含多种类型，属于多值分类问题.大部分数据样本集在最初的分类函数中是非线性的，需要采用非线性映射的方法，将原始的样本数据映射到相对高维的特征空间中，使原本不可分的数据在此空间中变得线性可分.根据文献 15 的结论和经验，引用高斯核函数代替原式中计算向量乘法的内积，在计算时将与故障相关的变量进行较为精准的运算，从而能够得到多维空间中的最优超平面，完成对多维数据进行处理.高斯核函数具有普遍适用性的特点，通过参数的选择调整，它可以适用于任意分布的样本，能够将非线性的多维样本

20、映射到高维空间中，当目标值与特征值为非线性关系时可以进行转化计算.其特点与现有城市轨道交通故障数据的特点相吻合，现有数据不同维度的编码数值绝对值相差较大，且影响因素和故障类型不存在明显线性关联，通过高斯核函数能解决数据使用的问题.高斯核函数的核值在有效范围内改变时，不会使空间复杂度过大.因此，容易实现SVM 的优化过程.其表达式为k(x，x)=exp-x-x222（4）图 2SVM 基本思想示意图Fig.2Schematic diagram of the basic idea of SVM92张仪鹏等：基于支持向量机的地铁故障类型预测第 1 期式中：x-x表示在空间中任一点x到某一中心x之间欧

21、氏距离；为数据在特征空间的分布方式.步骤 4：使用核函数代入计算后，将其转化为对偶问题来进行求解，可利用拉格朗日乘子法来求其对偶问题，引入拉格朗日乘子i 0，yi 0，求对偶后的原优化问题变为L(w，b，a)=12w2+ai()1-yi(wTxi+b)（5）式中：i为拉格朗日乘子.对L的相关维度进行求导转换得到L(w，b，a)=maxai=1nai-12i=1ni=0naiajyiyjxTixjs.t.i=0naiyi=0，i=1，2，n，0 ai C（6）步骤 5：使用高斯核函数进一步处理后，对于多种维度映射到空间中新的分布为L(w，b，a)=maxai=1nai-12i=1ni=0naia

22、jyiyjf(xTi)f(xj)s.t.i=0naiyi=0，i=1，2，n，0 ai C （7）式中：f(x)为高斯核函数.求解该问题的最优解，即可获得超平面的最短间隔M.1.2 基于 SVM 模型算法步骤在二分类基础上，对于地铁故障的多种分类预测，需要通过构造新的多值分类器，多值分类器的构造一般采用的方法是：以 SVM 理论为基础，首先构造多值分类的模型，通过一定的方法对构造模型的目标函数进行优化达到多值分类的目的.本文采用Libsvm 来解决该问题，基于其提供的默认参数，本文通过二次开发，对源代码的修改，将模型进一步优化，使模型适应多维度下的训练和计算.同时，由于目前为止选取多值分类器还

23、没有统一的模式，最优SVM 算法只能基于经验16，该方法已经成熟地运用到汽车故障和事故中15.基于此，本文通过该方法对目标函数进行优化从而实现多值分类，共有 6 个步骤.步骤 1：采用“一对一”算法15来构造多值分类器.在故障分类方面地铁共计有 12 类故障，该方法对任意两个不同故障的数据样本分别构造一个子分类器，这样对于 12 类样本就总计有 66 个子分类器，每个子分类器均根据 SVM 的分类方法来进行分类.步骤 2：如果当构造故障 1 和 2 的子分类器时，选取属于故障 1 及故障 2 的数据作为训练数据，其对应的时间、线路、区间等数据作为输入，之后将属于故障 1 的数据标记为正，属于故

24、障 2 的数据标记为负.以此类推，分别使用 66 个子分类器对测试数据进行分类，并累计各故障类型的正负值并计算分数.这里将 12 类故障分别设定为B1，B2，B12型故障.步骤 3：分别用 66 个子分类器对数据样本进行分数测试，最后得到一组最佳的结果.故障初始值均为 0 分，对于B1，B2分类器，如果是B1获胜，则B1加 1分；否则B2加 1分.每两个分类器分别运算一次并进行打分.步骤 4：在子分类器的基础上寻找合适的参数，后对故障的数据进行训练学习，并将学习成果保存在模型之中，对于不同种故障类型对应的因子比重均不相同.步骤 5：将测试集因子输入模型并进行对测试集中数据结果的输出，将输出的故

25、障类型与实际出现的故障类型进行比较计算，输出测试集的准确率.步骤 6：如果准确率达到预期水平，则说明模型训练学习效果较好，可以将模型运用到预测之中；如果准确率较低无法满足要求，则需返回步骤 4中，重新调整优化参数进行进一步的学习.模型学习的内容在掌握的具体条件和数据支持下可以进行灵活矫正，随着城市轨道交通多种设备设施的更新换代，模型需要不断进行学习，进而能够掌握不同批次、不同生产企业的相关设备设施的故障特点，更加全面地考虑时间和空间分布，对于预测的准确率能够进一步提升.1.3 数据处理依据现有的某地铁相关故障数据，包括故障发生的时间、线路、发生故障的区间、故障类型，得到了故障数据的汇总信息.因

26、为使用支持向量机时对于所有相关因素都需要变为数值类型的数据，根据既有故障数据的统计，对于相关数据进行一定的归纳总结，并分别对不同的数据类型进行量化处理，赋予其不同的数值用来区分表示出不同的含义，使得到的最终数据信息能够符合模型输入的要求，以满足模型学习的必要条件.同时，样本数据既存在着时间、地点变量，也存在着经过人为编码而没有具体单位的变量.在相同度量单位的情况下，样本的数值大小间也会存在一定程度的差别.在实验过程中需要对样本数据进行归一化处理，将其控制在一定的区间内，更加突出变量对于数据结果的影响，同时消除每个变量之间的量纲效应，使得每个变量在实验中会有同等的表现力，实验更加具有可信度.对全

27、部数据的每一个因子作归一化处理，将因子缩放到93北京交通大学学报第 47 卷0，1 之间.归一化公式为yi=zi-zminzmax-zmin（8）式中：zi表示相对应的数据，zmin表示所有数据中最小值，zmax表示所有数据中最大值.1.4 参数调整对于城市轨道交通故障预测，libsvm 使用时有两个重要的参数 C 与 g.g 是选择高斯函数作为核函数后，该函数自带的一个参数.其大小与其计算公式中的呈反比关系，决定了故障数据映射到新的特征空间后的分布，g越大，对于故障类型的支持向量越少，g值越小，支持向量越多.其中g=122（9）与故障相关的因子个数影响训练与预测的速度，g反映了各个因子之间的

28、相关程度.取值太小，各个因子之间的联系比较松弛，学习过程相对复杂，推广能力得不到保证；取值太大，各个因子之间的影响过强，回归模型难以达到足够的精度.对于参数的调整，最普遍使用网格搜索法，其原理为将这两个参数在可能取值的范围内进行排列组合，把所有可能的组合结果生成“网格”.然后将每组均用于模型的训练，并使用交叉验证的测试集对准确率进行评估，准确率最高的组合即为最佳参数组合.首先确定 C 和 g 的取值范围，城市轨道交通故障预测的取值范围设定为参数的最大范围，即 10-5，105，之后用确定范围内的 C 和 g 把训练集作为数据集，使用模型自我验证方法得到在此组取值下验证的准确率.本文模型采用网格

29、搜索法包括 3个步骤.步骤 1：在初始状态下，网格搜索法确定参数区域搜索区间为 10-5，105.步骤 2：设置参数搜索的步长，从起始点出发，沿着参数的不同增长方向运动单位步长，在单位运动步长的终点继续沿着不同增长方向运动，由此可以每个单位步长为节点生成网格，而网格中的节点即为相应的参数，根据运算得出结果：C 和 g分别取32 768 和 0.007 812 5 时，验证准确率达到79.264 2%.步骤 3：在搜索区域内选取网格的节点，即惩罚因子和高斯核函数参数对（C，g），将其通过交叉验证实验验证该参数下的对于城市轨道交通故障预测的精准度.最终选定交叉验证准确率最高的一组 C

30、和 g的取值作为最佳参数进行下一步的实验.2 实验结果与分析2.1 数据维度对预测模型的影响分析使用收集到的某地铁故障数据共计 558条，首先随机选取其中的 10%即 56条数据作为测试集，选取时，使用 Matlab 中的 random 函数，它能够生成符合正态分布的随机数17，使用该函数从 558条数据中根据不同实验组的需要选取对应量的数据.其他数据为训练集进行训练，根据现有数据选取 3至 6个维度进行分组实验，其中 3个维度分别为：区间、小时、分钟；4、5、6维度分别在三维度的基础上增加线路，线路和星期，线路、月份和星期.得到准确率见图3.比较向量维度可发现，当向量维数增加时，预测精度在初

31、期逐渐增加，在某个向量维数时达到最佳预测效果，预测精度会趋于稳定.这是因为在现有数据中基本上为时间和地点维度，和发生的故障类型之间联系不够紧密.当向量维度太小时，该方法不能准确预测该时间段内可能发生的故障，因此预测效果较差；而维度较大时，可能会造成数据维度的多余，效果无法达到最佳.同时，向量维度的增加导致运算时间增加，占用内存加大负面作用，因此，实际应用时需要找出最佳的维度.2.2 噪声数据量对预测模型的影响分析根据某城市轨道交通实际运营情况，建立1 500条噪声数据，即正常运行状态下的运营状态数据，为了更准确地选取其中使用的噪声数据，并且使选中的数据成为高斯噪声

32、，再次使用 Matlab 中的random 函数，使用该函数从 1 500 条数据中随机生成需要数量的噪声数据，添加在增加噪声数据情况下的实验中.全部实验分为 5组，在现有的 558条事故数据的基础上，分别按照 0.5、0.75、1、1.25、1.5 分位增加噪声数据进行多组实验，实验验证的准确率图 3不同维度下的预测准确率Fig.3Prediction accuracy under different dimensions94张仪鹏等：基于支持向量机的地铁故障类型预测第 1 期见图 4.当噪声数据比例较低时，模型准确率和不增加噪声数据时差别不大，虽然模型会学习到一些噪声数据中的信息，但能够根

33、据现有信息进行正确的分类，说明噪声数据占比较低的情况下，噪声数据也是会被模型学习到，但对原有数据的影响并不十分明显.从总体实验结果可以看出：1）总数据量较多的情况下（增加的噪声数据较多），模型会首先学习到原始故障隐患数据样本中的特征信息，然后再学习到噪声数据中的信息，由于噪声数据信息量较大，会较明显地影响到模型对于故障数据的学习，其判别的准确率和稳定性都会出现明显下降.2）总数据量较少的情况下（增加的噪声数据较少），模型的学习会依旧稳定，受到噪声数据信息的影响明显不大，也未出现较大的波动，说明当噪声数据量较小时，模型能够保证一定的稳定性.但随着噪声数据比例的不断增加，噪声数据信息会对模型的分析

34、效果造成很大影响.2.3 模型对比分析本文模型与文献 9 提到的 BP 神经网络和极限学习机进行对比.其中 BP算法训练的过程为：BP神经网络的学习由正向过程和反向过程组成，示意图见图 5.首先信号由正向进行传播，故障隐患数据在输入层进行输入，到隐层中进行数据的处理和变化，对应故障隐患影响因素的权重等特征会出现相应的调整，在一系列的处理调整结束后，输出信号值从输出层输出，即对应故障隐患类型会进行输出，将输出的类型和之前确定的类型进行比较，对误差进行评估确定是否符合要求.若不符合要求，进行学习和训练的第二步，将误差进行反向传播，由输出层反向通过隐含层将出现的误差进行输入，根据分摊的原则分到每一层

35、的每个神经元，即分配到每个故障隐患影响因素，各层神经元根据误差信号修正各个影响因素的权重，来完成第二次的模型自学习过程.总体来说，BP 神经网络的训练就是对各个影响因素权值进行多次调整的过程.本文选用的参数为：隐藏层神经元个数为 10，训练步数为 5 000，目标误差为 0.001，学习速率为 0.001，动量为 0.9，在此基础上使用 Matlab建立 BP神经网络模型18.极限学习机的原理是一个线性参数模式的拟合计算，其学习过程可以调整至极值收敛，收敛值一般为输出值.在本文使用的 558条数据之中，使用共计6个隐含层节点和 3个输出层节点的极限学习机19，其学习和输出步骤为：首先需要将故障

36、数据随机分配在设定的节点中，通过设定计算所需要的节点和参数，将现有数据分别输入节点中，为模型的初步学习做好准备.经过初步的学习和计算，将故障数据转化为隐含层的输出矩阵，其行数为输入的训练数据个数，列数为隐含层节点数，通过输出矩阵能够使模型进一步学习不同故障类型的特点，也就是将其不同维度（线路、区间、时间等）所包含的信息全部纳入训练之中.在训练后的基础上，开始求解输出权重，通过对故障不同影响因素权重的学习和计算，极限学习机能够求解出误差最小的一组，通过这一组数据对测试集输入的数据进行计算，最终的输出为测试集的预测结果，将结果与实际情况进行对比，能够计算出预测的准确率.从现有数据中分别选取相同的训

37、练集和测试集数据，共计分为 50 组，每组训练集和测试集比例与之前实验相同，共计 50 组对比实验，将实验结果的预警准确率和错误率计算平均值，对比结果见图 6.图 4不同数据量下的预测准确率Fig.4Prediction accuracy under different data volumes图 5BP神经网络示意图Fig.5Schematic diagram of BP neural network95北京交通大学学报第 47 卷相比于 BP 神经网络模型和极限学习机，SVM 城市轨道交通故障概率预测方面具有较高的准确率.3 结论1）通过模型学习和结果输出的方式进行预测，避免了预测过程中人

38、为因素的影响，预测结果更加客观可信且满足故障预测的准确率要求，具有将该种方法用于城市轨道交通故障预测的可行性.2）当噪声数据和原数据比例达到 100%的情况时，6 个维度的实验中，准确率没有明显下降.由此可知，模型具有较强的学习能力以及预测能力，在开始时学习的信息为有效数据，但是随着噪声的增加，样本里面一些不正确的信息还是会添加到模型中来，导致预测能力下降.3）随着含有噪声数据样本的增加，学习的难度加大，本身的准确率也很难持续提高，且波动也在增大.因此在含有噪声数据的数据集实验时，建议使用较小的总数据量，同时当发现测试集准确率不断提高，但是在训练集输出时准确率反而下降时，则可能已经学习到很多的

39、噪声信息，需要及时停止训练，以得到学习效果较好的预测模型.虽然在此模型下，城市轨道交通故障预测具有一定效果，但试验仍存在一些局限性.例如，现有数据资料和故障发生之间的关联性不强，维度还需要进一步选取调整.如果能够获取更多的数据量或者获取的数据和故障发生的关联性加强，准确率将会得到提高.在未来的研究中，应考虑更多影响较强的相关因素，提高预测的准确率.参考文献（References）：1 周建高，王凌宇.我国大城市居住区规划标准与交通拥堵关系初探：以北京为例 J.中国名城，2018（12）：415.ZHOU Jiangao，WANG Lingyu.A preliminary study on th

40、e relationship between urban residential area planning standards and traffic congestionJ.China Ancient City，2018（12）：415.（in Chinese）2 张珊.地铁车辆关键系统故障分析与检修策略优化 D.北京：北京交通大学，2019.ZHANG Shan.Fault analysis and maintenance strategy optimization of key system of metro vehicle D.Beijing：Beijing Jiaotong Uni

41、versity，2019.（in Chinese）3 尤丽静.地铁环控系统轴流风机故障诊断方法研究 D.天津：天津理工大学，2010.YOU Lijing.Research of method on faults diagnosis of axial fan in the environment control system of metro D.Tianjin：Tianjin University of Technology，2010.（in Chinese）4 徐晓锋，刘军，卞涛，等.基于模糊理论对地铁车辆制动系统故障诊断 J.新技术新工艺，2020（5）：7880.XU Xiaofeng

42、，LIU Jun，BIAN Tao，et al.Fault diagnosis of subway vehicle braking system based on fuzzy theory J.New Technology New Process，2020（5）：7880.（in Chinese）5 葛文波.浅谈地铁车辆故障及维修技术 J.科技风，2020（1）：153.GE Wenbo.Talking about the trouble and maintenance technology of metro vehicles J.Technology Wind，2020（1）：153.（in

43、 Chinese）6 张徐.地铁机电设备故障监测与智能诊断系统应用研究 J.价值工程，2019，38（35）：172173.ZHANG Xu.Application research on fault monitoring and intelligent diagnosis system of subway electrical and mechanical equipmentJ.Value Engineering，2019，38（35）：172173.（in Chinese）7 时旭.地铁车门系统故障诊断与维修决策的方法研究 D.北京：北京交通大学，2009.SHI Xu.Method of

44、 fault diagnosis and maintenance decision on vehicle door system in subway D.Beijing：Beijing Jiaotong University，2009.（in Chinese）8 李永娜.基于支持向量机的回归预测综述 J.信息通信，2014，27（11）：3233.LI Yongna.Review of regression prediction based on support vector machine J.Information Communications，2014，27（11）：3233.（in C

45、hinese）9 李慧，张南南，曹卓，等.基于机器学习的恐怖分子预测算法 J.计算机工程，2020，46（2）：315320.LI Hui，ZHANG Nannan，CAO Zhuo，et al.Terrorist prediction algorithm based on machine learning J.Computer Engineering，2020，46（2）：315320.（in Chinese）10 刘小生，章治邦.基于改进网格搜索法的 SVM 参数优化 J.江西理工大学学报，2019，40（1）：59.LIU Xiaosheng，ZHANG Zhibang.Paramete

46、r optimization of Support Vector Machine based on improved grid 图 63种方法正误率对比图Fig.6Comparison of three methods96张仪鹏等：基于支持向量机的地铁故障类型预测第 1 期search methodJ.Journal of Jiangxi University of Science and Technology，2019，40（1）：59.（in Chinese）11 李涛，王立晓，左志.基于极限学习机的交通事故严重程度预测 J.交通科技与经济，2018，20（5）：611.LI Tao，WA

47、NG Lixiao，ZUO Zhi.Prediction of the severity of traffic accidents based on extreme learning machine J.Technology Economy in Areas of Communications，2018，20（5）：611.（in Chinese）12 PANG B，LEE L，VAITHYANATHAN S.Thumbs up？：sentiment classification using machine learning techniquesC/EMNLP02：Proceedings of

48、 the ACL-02 conference on empirical methods in natural language processing.Stroudsburg，2002.13 WHITELAW C，GARG N，ARGAMON S.Using appraisal groups for sentiment analysis C/CIKM 05：Proceedings of the 14th ACM international conference on information and knowledge management.New York，2005.14 YE Q，ZHANG

49、Z Q，LAW R.Sentiment classification of online reviews to travel destinations by supervised machine learning approaches J.Expert Systems with Applications，2009，36（3）：65276535.15 张静萱.基于特征选择的城市快速路实时交通事故风险预测 D.北京：北京交通大学，2018.ZHANG Jingxuan.Real-time traffic accidents potential prediction of express way b

50、ased on feature selection D.Beijing：Beijing Jiaotong University，2018.（in Chinese）16 白瑞.基于 LIBSVM 的东洞庭湖叶绿素 a浓度反演及水体富营养状态评价 D.长沙：中南林业科技大学，2019.BAI Rui.Inversion of chlorophyll A concentration and evaluation of water eutrophication status in east Dongting Lake based on LIBSVM D.Changsha：Central South U

展开阅读全文