收藏 分销(赏)

铁路建造系统数据共享平台研究_张红勇.pdf

上传人:自信****多点 文档编号:457010 上传时间:2023-10-11 格式:PDF 页数:5 大小:2.05MB
下载 相关 举报
铁路建造系统数据共享平台研究_张红勇.pdf_第1页
第1页 / 共5页
铁路建造系统数据共享平台研究_张红勇.pdf_第2页
第2页 / 共5页
铁路建造系统数据共享平台研究_张红勇.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Science&Technology Vision科技视界0引言川藏铁路作为中国国内第二条进藏铁路,全长1838 千米,连接了四川省和西藏自治区,是中国西南地区的干线铁路之一,其建设对于西藏的经济发展具有极大的促进作用1。川藏铁路的建设难度无疑是巨大的,除了需要克服在高原建设铁路的种种难关,还需要处理其线路经过许多危险区域的问题2。从建国初期开始进行川藏铁路的勘察工作,到 2021 年 6 月已经实现了我国首条高原电气化铁路开通运营。目前,新的川藏铁路线路也相继进行了招标和开工建设,其建造的复杂性需要更加强有力的技术支持。随着科技的不断发展,我国铁路隧道向着信息化和智能化的方向迈进,借助信息技

2、术降低铁路建设的困难程度,逐步推动我国铁路建设由高速发展向高质量发展迈进3。作为铁路建造的基础,对数据高效利用的需求推动数据共享平台的建设。本文调研铁路建设的发展现状,梳理分析数据的关键作用;学习铁路建造中相关专家学者在数据领域做出的研究贡献。根据调研的信息,结合铁路实际应用需求构建铁路建造数据共享平台的系统架构,并且介绍密文策略属性加密算法与针对 DDoS 流量检测算法保障数据共享平台的安全性,通过该平台打破数据壁垒,实现系统数据的互联互通、共建共享。1铁路建造研究现状川藏铁路建设项目具有里程长、构建难度大的特点,在实际建设中需要海量多源异构的数据,但是目前的数据处理和使用中存在数据难以共享

3、互通的现象,数据的分散使铁路建造无法充分挖掘和利用数据中蕴含的隐藏信息,所以如何利用信息化的手段对数据进行采集、处理、共享和存储成为铁路工程建设现代化急需解决的问题4。为了分析项目因素与高速铁路施工工期之间的关系,王朝俊5收集利用了铁路建设数据,将它们用于DOI:10.19694/ki.issn2095-2457.2022.26铁路建造系统数据共享平台研究张红勇1左睿1王佳星2(1.中铁云网信息科技有限公司,北京100039;2.北京邮电大学,北京100876)【摘要】近年来铁路发展十分迅速,川藏铁路作为 新世 纪 的 伟 大 工 程,建 造 中 的 复 杂 性 要 求 大 量 数 据 的 支

4、 持 和 互通。随着信息技术的不断发展进步,如何利用信息化 的 手 段 打 破 原 本 铁 路 建造 中 各 系统机 构 间 的 数 据 孤 岛 的 现 状,实现 数据贯通与分析,为铁路建 造 提供有力的数据支 持,是 现 阶 段 研 究 的 重点 问题。本文分析了 铁 路 建造 的研 究现状,结合 需 求 构 建 铁 路 建 造 数 据 共 享 平 台 的 系 统 架 构,为 保 障 数 据 共 享 的 安 全 性,运 用 联 盟 链 帮 助 数 据 的 存 储 与 共 享,提 出密 文 策 略 属 性 加 密 算 法 控 制 数 据 的 访 问,提 出 针 对DDoS流 量 检 测 算 法

5、,检 测 对 系 统 的 恶 意 干 扰。该 架 构 的 提 出 为 该领 域数据贯通相关方 向的发 展和信息化进程提 供 有 力 的借鉴。【关键词】川藏 铁路;铁路建造;数据共享;数据贯 通作者简介:张红勇,高级工程师,研究方向为BIM技 术,智 能 建造等。左睿,高级工程 师,研究方向为智能建造、北斗 技 术 应用。王佳星,博士(在读),研究方向为区块链等。科学课堂09713科技视界Science&Technology Vision统计回归分析中分析相关参数的影响。史剑6设计了数据交换平台框架来解决铁路建设项目中地域分布复杂和工程数据多样性的问题。为适应信息化发展的现状,解决传统数据中心扩

6、展受限,李斌7提出了铁路云数据中心总计技术架构,为铁路云数据中心的建设提供强有力的理论与技术支持。针对铁路缺乏科学化地理数据管理系统的问题,陈隆8提出了建立铁路地理数据管理系统,提高了数据管理的科学性。2系统架构根据实际需求与平台规划,将铁路建造系统数字共享平台架构分为五个层次,分别为应用层、数据服务层、数据处理层、感知层、基础环境层。架构各层次及具体内容如图 1 所示。(1)应用层:应用层为数据共享平台的系统应用界面,操作人员由此页面进行数据的查询、存储等操作。根据使用的人的职责不同,对他们开放不同的接口接入平台。配备了相应的管理人员,分别通过平台对数据和数据涉及的业务进行管理,同时配备系统

7、管理与维护人员,推进数字共享平台的正常运行。(2)数据服务层:数据服务层主要分为数据共享服务模块和数据与模型构建模块。数据共享服务模块主要围绕的是数据生态系统,该模块是整个数字共享平台的核心,通过该模块实现对多源异构数据的统一存储、管理、更新和维护;实现对平台的基础空间数据的共享;共享其他部门体系的专题数据,真正实现在避免信息重复建设和信息孤岛的前提下,实现数据的互通共享。在数据与模型构建模块,以数据共享服务模块为支撑,实现对数据的有效利用,利用共享数据进行信息整合,为铁路建造过程中的必要工程提供信息化分析,构建各种数字化模型,包括构建地理环境模型、结构模型、施工过程模型、运维模型等,能够实现

8、对建造工程难题进行攻克和对建造过程的有效监控。图1铁路建造系统数字共享平台架构科学课堂098Science&Technology Vision科技视界(3)数据处理层:主要实现对数据的处理工作,作为数据服务层的基础支撑。数据处理层主要包括三个部分,从下而上分别是数据预处理、数据存储与计算、数据分析,三层在逻辑上是推进的关系。感知层获取数据后,首先进行数据预处理工作,在数据预处理层完成数据清洗、数据转换、数据描述、特征选择、特征抽取。在数据清洗阶段,首先处理缺失值和噪声数据。数据缺失表示为存在 NA 的数据,噪声数据则表示为异常值。对于这两类问题数据,可以根据数据在其中的影响程度来决定处理方式,

9、如果数据的影响不大,那么就可以将该数据直接去除;如果有一定的影响,那么可以根据相关特征进行推测填补,针对连续数据也可以使用均值或者中值进行填补。在数据转换阶段,对数据进行采样、转换和归一化处理。通过采样查看数据集的数据类型,再将不同数据集转化为数值型数据,消除特征之间的量纲影响,对数据进行标准化处理。在数据描述阶段,可以根据具体数据的需要进行统计并实现数据的可视化。特征选择是指对数据进行分类别存储时针对该部门所需要的数据进行相关特征提取,去掉冗余的特征信息。特征抽取是指借助主成分分析法和线性判别方法对高维度数据进行的降维处理。在对数据进行处理之后,在数据存储与计算层对数据进行使用与处理。数据混

10、合存储中心存储不同部门共享的数据,并且根据具体部门和数据类型对数据进行分类。这个中心主要负责共享数据的存储,借助相关的技术来保证不同数据的机密程度,实现在共享的同时防止发生数据篡改和机密数据遗失的情况,具体涉及的关键技术将在第三部分进行详细的介绍。除此之外,存储中心还与数据实施处理中心进行数据的交互,从存储中心提取需要处理的数据,根据具体需要实施再次处理的数据也会保存在数据混合存储中心中。由于需要借助信息化的手段利用数据,所以平台架构在设计的时候,还考虑到对数据的运用上。借助信息技术的手段,将普通共享存储的数据进行综合分析,从中抽取到深层次的对铁路建造有帮助的信息。根据数据分析的类型不同,我们

11、将分析的数据分为探索性数据、定性数据、离散数据、在线数据。而根据数据分析的处理方式不同,分为数据挖掘、机器学习、深度学习、人工智能和统计分析这几个数据分析的方式。(4)感知层:主要进行数据的收集工作。根据数据产生方式的不同,将数据分为铁路建造相关部门数据和实地感知数据。相关部门数据是铁路建造过程中从初始勘察、设计到实际施工和完善等工作所产生的数据,该数据包括了历史记录的数据和当下建造过程中产生的数据。实地感知数据是指当地地形、气候状况、植被覆盖等自然条件的数据信息,通过摄像头、各类型传感器和 GPS 等工具探测获得。(5)基础环境层:为促进整个平台的运行,需要相应的软件和硬件环境作为平台运行的

12、支撑。其中包括了网络体系、运行生态、计算机存储系统和安全系统。除此之外,还有相应的标准体系作为对平台运行和使用的规范。整体体系从数据的使用规范、系统运维规范、平台管理规范和安全等维度进行标准体系的约束。3关键技术研究对支持整个系统安全运行的技术进行介绍。3.1区块链技术区块链是一种由节点参与的、去中心化的分布式数据库系统,其本身是一串使用密码学的相关联的数据块,数据块中存储着有效确认的信息。区块链的主要作用是储存信息,任何需要保存的信息,都可以写入区块链,也可以从里面读取。区块链没有中心节点,信息存储在所有加入进区块链网络的节点当中,每个节点都是平等的,都保存着整个数据库。你可以向任何一个节点

13、写入或者读取数据,所有节点最后都会同步,从而保证区块链的一致性9。由于区块链具有透明化、去中心化、开放性和信息不可篡改性等特点,所以我们在构建数据混合存储中心的时候考虑借助区块链技术作为支撑。又由于不能完全对外开放所有数据信息,所以选择联盟链作为存储中心的一部分。根据数据的重要程度不同,分为需要加密的数据和开放性数据。如图 2 所示。为了方便数据的共享,我们将数据存储在云端,方便不同数据使用者进行数据的读取操作。开放性数据直接存储在云端,这一部分是基础数据,保密程度科学课堂099科技视界Science&Technology Vision比较低,存储在云端除了有助于建造工程中数据的方便共享和使用

14、,还有助于其他相关行业对数据的利用,提高了数据的利用率。图2用户读取数据分类借助联盟链存储有一定保密级别的数据。联盟链是一种由多个机构共同参与管理的一种区块链,数据只允许系统内不同机构读写和发送。为了保证数据的安全性和隐私性,使用一种密文策略属性加密算法对数据的访问进行控制。这是一种比角色访问控制更细粒度的加密算法,只有当用户的属性集合满足相对应的访问控制的时候才可以使用相对应正确的密钥去解密密文,获得真正的信息。这就限制了数据共享的范围,使数据在共享的前提下还能保障数据的安全性。算法的一般流程如下:(1)输入一个安全参数,获得对应的密钥 CK和公钥 PK。CK,PK=Dist()。(2)输入

15、数据 D、访问结构 T、公钥 PK,输出根据加密后的密文S=Encrypt(PK,D,T)。(3)输入用户的属性 Z(相关获取数据信息的资格证)、密钥 CK,输出对应的私钥 SK。(4)对比用户的私钥 SK 和 Z,如果满足 ZT,那么可以获得解密后的数据 DD=Decrypt(SK,Z)。3.2针对DDoS流量检测算法在数字共享服务中,如果有恶意干扰系统的正常运行,可能会存在 DDoS 攻击的情况出现。DDoS 攻击被称为分布式拒绝服务攻击,是通过操纵僵尸主机,以大量的源主机向目标主机进行攻击的一种攻击手段10,攻击者往往针对各协议一些固有的逻辑漏洞进行利用,通过大量发送攻击数据占满服务队列

16、或是挤占正常带宽的形式阻止目标服务器正常提供服务。DDoS 流量检测属于机器学习领域中典型的分类任务,在前人的研究中,R.C.Staudemeyer 和 C.Omlin通过决策树的方式11,对 KDD 数据集中的各个流量特征进行了筛选,经过对比后最后选出 11 个与 DoS 攻击相关的重要特征。但在具体实验过程中,部分特征相关度较高,在实际模型训练过程中所提供的训练效果有限。在对这十一个特征划分不同的组进行分别训练后,去除了相关性过高的六个特征,最后保留了五个流量特征作为 DDoS 流量检测算法所关注的特征。这五个流量特征包含两个流量基础特征和三个流量统计特征,分别是:(1)流量数据包目标主机

17、所提供的服务类型;(2)该连接在结束时的连接状态,例如正常完成或发生错误;(3)在该连接所有数据包中从源主机到目标主机发送数据字节数;(4)在过去两秒内,在与当前连接具有相同目标主机的其他连接中,与当前连接使用相同服务的连接的百分比;(5)在此之前的 100 个连接中,与当前连接具有相同目标主机并且使用相同服务的连接中,出现 SYN错误的连接所占的百分比。对于 TCP 流量,后三个特征需要对 TCP 会话进行重组。同时针对我们数字共享模块所研究的范围,对这五个特征进行了适当的简化,假设被攻击主机均只提供 http 服务。其次,根据前面数字化的方法,将流量特征 5 修改为“在之前的 100 条连

18、接中,与当前连接目标主机相同且所调用的服务相同的连接中,未正常完成的连接所占的百分比”。决策树算法是一种有效的机器学习分类算法,在进行分类时,我们可以根据数据中各个特征的值划定范围,并根据该范围构造一棵树,帮助我们进行分类。根据这棵树,我们能够逐步将数据样本进行分类,这一棵树被称作“决策树”。科学课堂100Science&Technology Vision科技视界构造决策树的算法主要有 ID3、C4.5 和 CART 三种。在本研究中所使用的 sklearn 库中的决策树算法,默认使用 CART 方法来构建决策树。在生成决策树时,可以根据实际研究情况,通过调整其他参数来尝试寻找最优节点和最佳分

19、支方式,构建最适合该研究情况的决策树。CART 算法使用“Gini 指数”来进行信息不确定的计算,并使用“Gini 指数”最小作为节点分裂时的依据,最终生成一棵二叉树作为构建结果。当一组信息中包含类信息,对于中的一组信息,该信息属于类型的概率为,则此时这组信息的 Gini 指数为:Gini(X)=1-mi=1p2i#当这类数据出现的概率相同时,取最大值;当这类数据均相同时,取最小值。在使用 CART 方法构建决策树时,通过对于每个特征计算加权 Gini 指数,选择加权 Gini 指数最小的一个特征作为当前节点分裂时所选用的特征依据。对于本模块中假设的二分类情况,当 DDoS 数据与正常数据条目

20、数量各占总数据量的 50%时,则这组数据的熵取最大值 1,Gini 指数亦取最大值 0.5。4结语数据的共享影响着整个铁路的发展,应用多种新兴技术实现铁路系统中数据的共享,促进川藏铁路的安全高效建设已经成为铁路建设发展的重要趋势。除此之外,数据共享中的安全问题,也是需要研究的重点问题。本文介绍了一个铁路建造数据共享平台的基本架构,并且详细介绍了为保障系统安全,抵御可能产生的影响平台的攻击而作为架构支撑的云与区块链共同存储模型及针对 DDoS 流量检测算法。该架构为铁路数据共享提供了有力的技术支持,整个数据共享架构可以为铁路的发展提供借鉴作用。【参考文献】1谯珊.孙中山与川藏铁路建设的构想J.福

21、建论坛(人文社会科学版),2013(5):92-97.2魏强,李照星.川藏铁路施工组织技术研究J.管理现代化,2020,40(6):25-31.3王万金.铁路建设项目管理的强化解析J.科技视界,2015(21):219-219,232.4施卫忠.铁路数据中心建设与规划研究J.中国铁路,2021(1):1-7.5王朝俊.铁路建设数据收集和处理用于统计回归分析J.环球市场信息导报,2013(28):83-83.6史剑.铁路建设项目管理信息系统数据交换平台研究与设计J.铁路计算机应用,2007,16(7):22-24.7李斌.基于超融合基础架构的铁路云数据中心建设方案J.铁路通信信号工程技术,202

22、1,18(3):54-58.8陈隆.铁路地理数据采集与管理系统建设应用探讨J.勘察科学技术,2020(4):45-49.9蔡晓晴,邓尧,张亮,等.区块链原理及其核心技术J.计算机学报,2021,44(1):84-131.10Hoque N,Bhattacharyya D K,Kalita J K.Botnet in DDoS Attacks:Trends and Challenges J.IEEE Communications Surveys&Tutorials,2015,17(4):2242-2270.11R.C.Staudemeyer,C.Omlin.Extracting salient features for networkintrusion detection using machine learning methodsJ.South AfricanComputer Journal,2014(52):82-96.科学课堂101

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服