1、第 11 期 山 西 焦 煤 科 技 No.112023 年 11 月Shanxi Coking Coal Science&TechnologyNov.2023问题探讨收稿日期:2023-08-29作者简介:郝志伟(1968),男,山西太原人,1990 年毕业于电子科技大学,正高级工程师,主要从事数字化转型顶层设计及技术研究等工作(E-mail)358826947 大型煤炭企业数据中台设计方法探究郝志伟,郭超(山西焦煤集团有限责任公司 大数据中心,山西太原030024)摘要针对大型煤炭企业普遍存在的业务系统庞杂、信息孤岛和数据壁垒严重,导致集团对子分公司管控能力不足、存在安全生产经营风险等问题
2、,提出一种数据中台架构,并探讨了数据中台建设中面临的数据标准体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等 6 方面关键技术,为建设适用于大型煤炭企业的数据中台,推动企业大数据融通共享、各业务系统协同联动和深度分析应用提供有益的经验借鉴。关键词数据中台;信息孤岛;融通共享中图分类号:TD67文献标识码:B文章编号:1672-0652(2023)11-0039-04大型煤炭企业多数存在以下问题:总部业务部门需求不明晰、数据标准不统一、数据质量不规范、数据安全不可控,各业务系统独立运行、异构不兼容,像一个个烟囱,很难统一和打通,无法实现数据的有效共享、业务的流程联动和系
3、统的全面协同,导致集团对人 财物、产供 销等业务的 管控力度 不足,使安全生产经营等过程存在风险、隐患和漏洞;子分公司及厂矿单位多存在采掘机运通等专业业务系统多,数据孤岛现象严重,且业务系统数据填报不准确、信息输入不及时,甚至不愿上报真实数据等。为解决上述问题,需要构建各业务系统数据共享和流程互通的共同底座,以打通各业务系统,促进企业大数据的融通共享、协同联动,提升集团管控能力。数据中台作为全新的企业管控理念,以服务企业业务运营为目标,汇聚、整合、存储煤炭企业安全生产经营业务大数据,经加工整理后的有用数据可通过挖掘、分析直接应用于具体业务,帮助优化业务流程,打通业务系统间的“部门墙”,促进业务
4、流程标准化、工作标准信息化、企业信息智能化,为煤炭企业实现减人提效、对业务系统扁平化和人财物产供销等核心资源的精益化管理奠定数据架构基础。1国内外研究现状国内外多个研究者对数据中台技术进行了相关研究。苏萌等1总结了数据中台技术的相关进展,提出数据中台通用技术架构。艾瑞咨询2从市场规模、适用行业、发展路径等角度总结整理了 2019 年数据中台在中国的发展情况。周纲等3介绍了一种应用于电力营销服务业务的数据中台设计方法。李炳森等4设计了适用于电网企业的数据中台贴源、共享、分析三层服务架构,并研究了关键技术。罗薇5提出了一种应用于通讯行业的中台一体化生产体系,强化了生产协同,提升了用户体验。于浩淼等
5、6基于数据中台的一般体系架构,提出中国联通国际公司中台建设方案。李广乾7、刘童桐8探讨了数据中台的内涵和外延。刘颖慧等9分析了不同企业的中台战略和架构,提出了通讯运营商的数据中台建设方法和类型。PTC10从体系架构、建设架构、落地思路等方面探讨了工业企业建设数据中台面临的关键问题。谭虎等11阐述了阿里云数据中台的一些建设思路。刘俊良12研究了数据中台架构设计、关键技术。陈小勇等13论述了数据中台设计思路、总体方案、关键技术等。但上述研究多为通讯、电力等行业的数据中台建设探究,尚未发现针对大型煤炭企业建设数据中台方法的相关研究。针对大型煤炭企业普遍存在的问题,设计了一种数据中台技术架构,从数据标
6、准体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等 6 方面研究探讨了数据中台建设中的关键技术,为建设适用于大型煤炭企业的数据中台,推进各业务大数据协同联动和深度分析应用提供可借鉴的解决思路。2数据中台技术架构结合大型煤炭企业特点,数据中台建设可遵循以下流程:采集集团人力、财务、设备、生产等核心业务数据,基于规范统一的数据标准,在保障数据质量的前提下,对数据进行清洗加工等处理,存储到数据仓库,形成可以复用的元数据,沉淀共性数据及服务,实现一次录入数据,在数据控制权限内所有业务系统共享,构建业务共享和流程互通的共同底座;对数据进行建模,利用大数据建模、算法等开展主题分析
7、等大数据挖掘、分析应用,实现利用大数据对企业人员流、资金流、物资流进行在线监控,防控企业风险,研判安全生产经营趋势,充分支持各层级领导决策的目的。同时,通过提供统一应用展示门户,对内支撑集团安全生产经营等业务数据应用,对外统一构建与政府监管部门、客户、供应商等的安全可控数据交换出入口,由集团统一、安全、高效地把控对外交换数据,支持集团多维度的精益化管理,实现全方位、全链条、全域赋能全集团管理升级。典型的数据中台架构见图 1,主要包括数据源、数据采集处理、数据库、数据管理、大数据分析、应用展示等 6 部分。图 1数据中台架构图一个典型的数据中台的数据流见图 2,通过对集团业务系统中数据的抽取、清
8、洗、转换等工作,存储进集团数据库,根据各层级领导对不同主题数据分析的需要,利用相关建模和算法对数据仓库中的相关数据进行主题分析、展示,支持各层级领导决策,并将分析结果及时应用到集团相关业务部门,保证领导决策的快速高效执行。3关键技术分析数据中台建设的关键技术主要包括数据标准规范体系建设、数据采集处理、数据库选择、数据管理、大数据分析应用、新技术应用等 6 方面。3.1数据标准体系建设围绕大型煤炭企业生产、运输、销售全链条,人力、财务、设备、生产、供应、销售、法务、投资、办公全业务,通过制定数据源输入标准、主数据企业标准、编制并出台相关数据标准管理办法、开展集团相关业务数据清洗等方式,推动集团各
9、业务系统数据标准统一、规范使用,逐步构建包括规范定义、术语、模型架构、元数据命名规范、编码规范等在内全集团统一的数据标准体系。同时,通过加强对各子分公司的督导管理,规范集团公司数据标准体系的统一应用,为数据存储、管理、分析应用和展示奠定标准基础。04山 西 焦 煤 科 技2023 年第 11 期图 2典型的数据中台的数据流图3.2数据采集处理建设大型煤炭企业全集团统一的数据采集平台,根据数据源输入标准,对人力、财务、设备等各分散、凌乱的业务数据进行采集汇聚,通过 ETL 等技术,形成清晰有序的有用数据,存储到数据仓库中,形成元数据,实现数据一次采集或录入、所有业务共享共用,满足企业对煤炭安全生
10、产、经营管理等业务数据管理要求的同时,为集团级的大数据分析提供统一的标准数据保障。3.3数据库选择相比于 Mpp 数据库,Hadoop 拥有更多的计算节点数、更大的 数据量,适用 于存储 关 系 型、半 关 系型、无结构化、语音、图像、视频等多种数据类型,因此,Hadoop 数据库适用范围更广泛,但当面对需要大规模并行处理的场景时,Mpp 更有优势。大型煤炭企业涉及人力、财务、设备、销售、投资、办公等多业务复杂的应用场景,应选择 Mpp 和 Hadoop 混合型数据库作为存储媒介,以构建一套既能管理全域业务数据、又能支撑上层应用需求的新型数据库,为实现快速高 效的数据 挖掘、分析提 供数据存
11、储支持。3.4数据管理数据库中数据按照一定的数据标准和质量规则汇集形成元数据和主数据,高质量的元数据和主数据可形成不同的主题数据库,有效支撑大型煤炭企业进行安全生产、销售管理、设备资产盘活等不同主题的大数据分析。同时高质量的元数据和主数据可对企业不同业务提供全集团统一的数据共享和服务,从而实现各业务信息互通、数据共享和全面协同,增强企业竞争力、管控力和抗风险能力。3.4.1元数据管理元数据可以让企业数据资产用清晰直观的方式进行呈现,对元数据的管理包括元数据基础管理、元数据质量管理、元数据分析等。其中,元数据基础管理包括对元数据添加、删除、修改,元数据间关系建立、维护,元数据自身质量的核查,元数
12、据查询、统计等;元数据质量管理包括对元数据属性、关系及安全性和一致性的检查等;元数据分析主要指通过血缘分析、影响性分析、实体关联分析、全景分析等,直观了解元数据来源、流向、被引用次数等重要信息,以实时掌握元数据真实状况。3.4.2主题数据管理对大型煤炭企业财务、采购、科研等不同主题域数据的管理能有效支撑不同主题的大数据分析,同时,各主题域内部,不同来源的数据可通过统一的标准基础数据实现相互的关联,例如,采购主题的供应商信息、合同信息等可通过客户编码、合同编码等,实现互相联系、互相融合;各主题域之间,来自于同一数据源的同样数据是互相共享的。采购主题中对供货、质检、合同分析的数据管理流程见图 3.
13、3.4.3数据质量管理通过建设包括质量规则、核对校验、监控诊断、质量报告在内的数据质量体系,能有效保障数据的完整性、一致性、合法性、关联性、唯一性。在大型煤炭企142023 年第 11 期郝志伟等:大型煤炭企业数据中台设计方法探究业的实际应用过程中,一个典型的数据质量管理流程如下:利用数据质量规则,对数据进行校验筛查,判断出的数据质量问题,反馈给相关业务部门进行确认、调整,以有效提升数据质量。图 3采购主题中对供货、质检、合同分析的数据管理流程图3.5大数据分析应用针对大型煤炭企业存在的痛点、难点问题,可以选择一个或者多个应用场景,通过数据建模、算法等,开展多业务协同的主题分析,对内支撑领导决
14、策分析和提升各业务精益管理水平,对外赋能客户、供应商等产业链数据,同时支持政府决策和服务社会关切。例如,针对企业各业务存在的信息孤岛严重,无法实现数据的有效共享、业务的流程联动和系统的全面协同问题,可开展产洗运销协同联动等大数据分析,让数据为管理赋能:对大型煤炭企业所属煤矿各类数据进行针对性建模、多维度分析和综合集成展示,并援引集团外部相关数据研判煤炭价格,预测市场走势,通过抓产销、带中间、堵漏洞,促进集团公司精益化管理水平的提升,辅助集团领导科学决策。3.6新技术应用在大型煤炭企业的数据中台建设中,加强对视觉识别、语音识别和 RPA 流程机器人等新技术推广应用,能有效提高数据利用率、降低劳动
15、强度、提升业务服务能力、实现业务技术创新。例如,利用语音识别技术,将原来需要通过 PC 端手动操作的方式转化为直接通过语音实现系统控制,并利用语音播报自动直观展示需查询、分析的结果;利用视觉识别技术和RPA 流程机器人,通过对网页或 PDF 等非结构化页面的采集或 OCR 识别,智能将所需数据实时、准确、高效自动填入表格,并生成汇总表,有效提升集团业务准确性、合规性和工作效率。4总结 针对大型煤炭企业普遍存在的业务系统庞杂、信息孤岛和数据壁垒严重,导致集团对子分公司管控能力不足、存在安全生产经营风险等问题,设计了一种数据中台技术架构,并从数据标准体系建设、数据采集处理、数据库选择、数据管理、大
16、数据分析应用、新技术应用等 6 方面探讨了数据中台建设中的关键技术,为建设适用于大型煤炭企业的数据中台,实现全集团数据的标准化、资产化、价值化、服务化、自主化和开放化提供一种可借鉴的参考。参考文献1苏萌,贾喜顺,杜晓梦,等.数据中台技术相关进展及发展趋势J.数据与计算发展前言,2019,1(1):116-126.22019 年中国数字中台行业研究报告J.互联网经济,2019(12):76-83.3周纲,王锦志,许道强,等.电力营销服务业务中台设计方法与支撑体系研究J.中国管理信息化,2020,23(1):83-89.4李炳森,胡全贵,陈小峰,等.电网企业数据中台的研究与设计J.电力信息与通信技
17、术,2019,17(7):29-34.5罗薇.基于大数据策略核心的中台生产体系建立J.经营管理,2020(1):80-83.6于浩淼,赵月芳,陈盟,等.企业中台建设思路与实践方案J.电信技术,2019(8):78-80.7李广乾.什么是数据中台J.中国信息界,2019(6):72-75.8刘童桐.数据中台建设中最重要的事J.通信企业管理,2019(7):25-27.(下转第 56 页)24山 西 焦 煤 科 技2023 年第 11 期速装置后,由于受到条形皮带的缓冲阻力作用,物料的流速降低。主要有以下优点:1)进入弧形筛的物料流速变慢,减少了对弧形筛的磨损,延长了弧形筛筛板使用寿命。2)物料在
18、弧形筛筛面停留时间延长,改善了弧形筛及脱介筛的脱介效果,降低产品带介,从而减少介质消耗。图 1重介旋流器集料箱缓冲装置示意图3效果对比及经济效益重介旋流器集料箱缓冲装置投入使用后,弧形筛入料流速显著降低,通过对改造前后筛板更换周期进行统计,结果显示,弧形筛筛板使用寿命由原来的810 天延长到 1214 天(见表 1).弧形筛筛面物料流速减缓,延长了物料在筛面停留时间,弧形筛脱介效 果 改 善、串 介 现 象 减 少,精 煤 产 品 带 介 量 由1.82 kg/t 降低到 1.30 kg/t(见表 2).经测算每年可节约弧形筛板费用约 24 万元,介质成本约 34 万元,合计可节约成本约 58
19、 万元。表 1改造前后精煤弧形筛筛板更换周期对比表设备编号名称更换周期/d改造前改造后311 精煤弧形筛1014312 精煤弧形筛10142307 精煤弧形筛812表 2改造前后精煤产品带介量对比表产品产品带介量/(kg t-1)改造前改造后313 精煤1.811.30314 精煤1.751.282308 精煤1.891.33平均1.821.304结语通过对高阳选煤厂重介旋流器集料箱缓冲装置进行改造,并成功应用于现场,解决了弧形筛入料流速快导致脱介效果差、精煤产品带介量高、筛板使用寿命短、检修工作量大等问题。该装置的改造应用不仅可以减少弧形筛筛板的磨损,节约弧形筛筛板费用,还可减少介质损耗,降
20、低原煤加工成本,取得良好的经济效益。同时该装置具有改造成本低、实用性强、效果显著的特点。参考文献1宁建军.重介选煤厂降低介耗的措施J.洁净煤技术,2013,19(3):30-33.(上接第 42 页)9刘颖慧,刘楠,蔡一欣,等.数字化转型中不同企业的中台战略及架构设计J.电信科学,2020,36(7):126-135.10数字中台如何助力业务转型J.软件和集成电路,2020(1):70-83.11谭虎,陈晓勇.详解阿里云数据中台N.中国信息化周报,2019-10-28.12刘俊良.新时代数据中台研究与设计J.电子世界,2020(5):119.13陈小勇,赫红宇,霍励.智慧运营企业中台的设计方案研究J.数字技术与应用,2018,36(11):110-111.65山 西 焦 煤 科 技2023 年第 11 期