1、 基于大数据分析的油气生产设备故障多维分析与预测 赵长军摘 要文章通过将油气生产设备的故障数据、配套物联网采集的故障期工况数据、设备维修保养记录数据等进行多维组合,通过Hadoop大数据分析技术,对设备的故障率进行分析,生成全面的设备质量参考数据;并依据故障率分析结果与实时工况数据进行大数据模型比对分析,实现设备的实时故障预测。通过对输入的多维数据进行整合,结合大数据技术在海量数据分析的优势,实现了对油气生产领域设备全方位的质量信息评估,并可据此采取针对性的质量改进与预防性措施,提升油气生产的安全性和经营效益。关键词多维分析;故障预测;大数据;油气生产设备DOI10.13939/ki.zgsc
2、.2017.12.2431 引 言油气生产行业所采用的各类数字化设备较多,随着行业的竞争加剧,如何减少设备故障引起的停产时间,如何优化采购降低设备故障率,如何提前对故障做出预测以提前应对,是石油企业所亟须思考和解决的问题。随着工业自动化技术、物联网技术、大数据技术在油气生产行业的开始应用,为解决上述问题提供了全新的思路。运用大数据技术,可高速有效分析多维度的设备实时运行数据,并结合其他静态和动态信息,对设备的故障进行分析和预测,分析结果为生产、经营和QHSE服务,实现技术手段和管理模式的革新,实现科学决策、卓越运营与安全生产,最终达到可持续的业务增长。例如茂名石化探索如何在不改变已知原料属性下
3、,实现在重整装置上提高汽油收率最高和汽油辛烷值最高的生产目标。为解决这个问题,采用大数据分析技术,收集了重整装置近三年的MES、HSE、实时数据库、腐蚀数据、ITCC、机泵监测数据、气象信息等数据,通过Hadoop建模,对重整原料历史数据进行主成分聚类分析,形成了典型的原料操作样本库,并据此快速确定每种原料类别下的最优操作方案。技术人员对近4600个批次的石油原料进行了分析建模,组成了操作样本库。通过该方法计算优化工艺操作参数,可使汽油收率从89.88%提高到90.10%,是大数据在油气生产行业应用的成功例子。本文拟通过将油气生产设备故障数据、配套物联网采集的工况数据、维修保养记录数据及工业自
4、动化数据组合应用于设备故障大数据分析,实现对设备的综合故障率分析与故障预测,从而为设备采购的最高性价比提供数据支撑,也为预防性维修维护提供决策支持,提升生产运行的安全性和企业经营效益。2 大数据分析技术的运用油气生产行业设备数据数量大,并发处理要求较高,对数据存储、处理、分析的巨大压力,要解决海量数据处理的问题就需要引入大数据技术。Hadoop是目前最流行和功能最强大的一个软件计算平台,可以很容易地开发和运行处理油气生产过程中的海量数据的分析模型。其核心部分主要包括HDFS(Hadoop Distributed File System)和基于MapReduce机制的并行算法实现。Hadoop提
5、供的分布式文件系统HDFS是建立在大型集群上可靠存储大数据集的文件系统,具有强容错性、流式数据访问与大数据集、硬件和操作系统的异构性的优势。而MapReduce是一种简化的分布式程序设计模型,用于处理和生成大量数据集。通过该模型,程序自动分布到一个由普通机器组成的超大机群上并发执行。MapReduce通过把对数据集的大规模操作分发给网络上的每个节点来实现可靠性,每个节点会周期性地把完成的工作和状态信息返回给主节点,实现大数据的并发处理。Hadoop的上述优点尤其适合于油气生产行业的海量数据分析应用。3 设备故障率多维分析设备故障率是评估设备性能优劣的一个重要指标。顾名思义,是设备故障运行与正常
6、运行的比率。通过统计的方法可以计算特定个体、特定型号、特定类型或特定厂商的设备的故障信息,对设备时间质量进行评估和横纵向对比。在油气生产中,设备的故障记录信息是故障率分析的依据,但因为实际运行中各个井站、矿区的运行情况不同也影响了设备发生故障的情况,因此还需要引入配套物联网采集的工况数据,以及日常的维修保养情况记录数据,将这些信息进行进一步组合,在Hadoop大数据分析中建模挖掘,得出更精确的设备综合故障率结果。本文采用的多维故障率分析,基于3个大类的数据:(1)设备故障信息:包括设备厂商信息、设备类型、设备型号、设备寿命、运行时间、故障类型、故障次数、故障时长、故障恢复时长等;(2)物联网采
7、集的工况数据:油气生产设备产量、流量、振动、位移,以及运行环境温度、湿度、处理物质腐蚀性等;(3)维修保养记录数据:保养级别、保养时间、更换配件比、维修时间、维修级别等数据。在Hadoop中,根据3类数据的权重、优先级,以及每个数据项的占比等,进行大数据分析建模。进而将各个维度的数据输入到Hadoop的MapReduce框架中,在计算模型中进行分析计算,最后得到分析结果。多维分析过程如图1所示。如上表所示,基于大数据分析的油气生产设备故障分析统计过程是从油氣生产中产生的多维数据(故障相关、设备相关、环境相关、操作相关)中获取在任意时间间隔内的某项故障相关的统计结果。其统计数据源是多维数据按一定
8、规则的组合,同时获得相应的不同维度的统计结果。下面以例子说明分析全过程。向MapReduce库输入单个设备编号参数、时间区段参数,向Job Tracker提交统计任务,MapReduce库将设备故障记录库中的数据分为m个分块。Map Tracker读取分块中的设备故障记录,作为map函数输入,map函数按设备编号和时间区段参数,将该分块内符合条件的设备故障记录统计出来,结果保存在中间键值对中。Reduce Tracker读取所有Map Tracker产生的中间键值对,将其归并为一组统计记录,从而得到单位时间内指定设备的故障率,或指定时间范围内该设备故障次数变化趋势等信息。 进一步,当输入参数为
9、设备型号、时间区段时,Map Tracker调用map函数,将分块文件中的属于该设备型号的所有设备列出,结果保存为中间键值对,作为下一级MapReduce过程的map函数输入,在下一级的MapReduce过程中,再使用上例中的过程,过滤不同编号设备在指定时间段内的故障记录并归并出相关统计信息。整个过程如图2所示。多维分析数据来源正是应用上述MapReduce过程或多次MapReduce过程的迭代,得到最终分析结果。多维数据的故障率分析方法,解决了传统单一数据对比未考虑实际运行环境、运行负荷、日常维护频度等方面的因素,通过组合计算达到分析结果更全面完整的目的,为设备管理、设备采购、巡检维修等日常
10、管理工作提供更准确的决策辅助。4 设备故障预测分析获得设备综合故障率结果后,可进一步实现设备的故障预测。对于井口装置、阀门等控制设备的常规维护手段多为定期检修或故障后维修,存在“过修”和“失修”现象,造成生产设备损耗和停产减产风险。通过设备的故障预测预警,在设备正常运转条件下,能够分析出潜在故障及原因、实现预知性维修,将能有效减少维修成本、降低非计划停工风险。对设备的故障预测预警,通过现场数据采集数据传输HDFS的数据存储对运行状态与故障模型进行并行计算大数据分析设备的故障预测几个步骤实现,如图3所示。通过现场的各类传感器,将重点设备的关键参数进行实时采集和传输,通过RTU或者DCS等设备,传
11、输到Hadoop的HDFS分布式文件系统中,按照流文件格式进行存储。设计MapReduce的设备故障预测模型,将几个采集上来的维度数据进行并行计算分析,分析算法可以Java程序方式实现基本的Map函数和Reduce函数。(1)MapReduce库先把预测算法程序的输入文件划分为M份(M为用户定义),每一份通常有16MB到64MB;然后使用fork将用户进程拷贝到集群内其他机器上。(2)被分配了Map作业的Task Tracker,开始读取对应分片的输入数据,包括此重点设备的振动、位移、温度等各个维度的数据。(3)接着进行Reduce作业。(4)当所有的Map和Reduce作业都完成了,MapR
12、educe函数调用返回预测模型程序的代码。通过以上方式,实时获取设备的振动、温度、压力、流量等数据,同时将数据输入到Hadoop故障预测模型进行实时分析比对,一旦比对类似,则可预测故障的近似发生时间,从而合理安排预防性维护,从而保证了设备维护更有针对性。5 结 论本文通过将与油气生产设备故障相关的工况数据、故障数据、维修保养等操作数据,作为多维数据源进行组合,输入到Hadoop大数据分析模型中,利用Hadoop的并行处理优势解决油气生产设备运行环境复杂、实时数据量大、影响因素众多的故障分析难点,为设备的优化采购提供依据;同时将故障分析结果进一步导入到故障预测中,也为预防性维修维护提供决策参考,提升油气生产运行安全和综合运营效益。参考文献:1赵庆周,李勇,田世明.基于智能配电网大数据分析的状态监测与故障处理方法J.电网技术,2016(3):774-780.2檀朝東,陈见成,刘志海.大数据挖掘技术在石油工程的应用前景展望J.中国石油和化工,2015(1):49-51.3李金诺.浅谈石油行业大数据的发展趋势J.价值工程,2013(29):172-174.4张春生,郭长杰,尹兆涛.大数据分析在油气行业的应用研究J.微型电脑应用,2016,32(7):64-67.5刘刚.Hadoop应用开发技术详解M.北京:机械工业出版社,2014. -全文完-