1、2023年第4期 总第174期铁路数据价值评估方法初探*丁传琛(中国铁路经济规划研究院有限公司 助理研究员,北京 100038)摘 要:随着数据成为生产要素和数据量的增加,铁路数据的价值逐渐凸显。科学地评估铁路数据价值是实现数据要素流通和促进数据价值转化的关键,但是目前业内对于数据价值评估方法的研究仍处于起步阶段。基于铁路数据的特征,研究构建了包含1个总目标、3个一级指标、9个二级指标、25个三级指标的体系,在传统成本法的基础上形成了融入收益法和市场法评估思路的改进成本法,并利用层次分析法与专家打分法构建了数据价值评估模型,对铁路数据价值评估工作具有参考价值。关键词:铁路数据;数据价值评估;A
2、HP;专家打分法文献标识码:A 文章编号:1004-9746(2023)04-0016-080引言2020年4月,中共中央、国务院发布 关于构建更加完善的要素市场化配置体制机制的意见,首次将数据纳入生产要素范围。数据在全社会层面基础性战略资源地位日益凸显,加快推进数据价值评估是落实国家关于要素市场化配置要求的重要实践,各行业如何科学合理地进行数据价值评估成为社会各界关注的重点课题。但是,目前国内外在数据价值评估领域的研究处于探索阶段,其中铁路数据价值评估方面更是处于起步阶段,且大部分数据安全级别高、流通交换少、专用性较强。在此背景下,充分考虑铁路数据特征,探索铁路数据价值评估方法,对于推进铁路
3、信息化高质量发展、助力实现铁路现代化具有重要理论意义和应用价值。1铁路数据价值构成研究1.1 铁路数据特征不同行业的数据具有不同的特征,这些特征差异会对数据的价值产生较大的影响。铁路数据是铁路行业内各单位在运营管理、人员管理、业务场景中产生、传输、存储的,具有价值的以图片、文字、视频、*基金项目:中国国家铁路集团有限公司科技研究开发计划项目“面向铁路全业务信息源的数据汇聚、分类及示范应用关键技术研究”(P2021S012);中国国家铁路集团有限公司科技研究开发计划项目“铁路信息系统无形资产估价方法及关键技术研究”(K2022Z010)Reform ThinkingReform Thinking
4、Reform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform Thinking
5、Reform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform ThinkingReform Thinking改革思维An Initial Exploration of Methods for Value Evaluation of Railway DataDING Chuanchen(China Railway Economic and Planning Research Institute Co.,Ltd.,Assistant Re
6、search Fellow,Beijing 100038,China)Abstract:As data becomes a factor of production and the amount of data increases,the value of railway data is gradually coming to the fore.Scientifically assessing the value of railway data is the key to realizing the circulation of data elements and promoting the
7、transformation of data value.However,the research on value evaluation methods for data in the industry is still in its infancy.Based on the characteristics of railway data,we establish asystem including 1 general objective,3 primary indicators,9 secondary indicators,and 25 tertiary indicators.Meanwh
8、iles,we form the improved costmethod incorporating the ideas of the income method and the market method.In addition,the data value evaluation model is constructed by using theanalytic hierarchy process(AHP)and expert evaluation method,which is of reference value for railway data value assessment.Key
9、 words:railway data;data value evaluation;analytic hierarchy process(AHP);expert evaluation method16音频等方式为载体的数据集合1。铁路数据除了具有非实体性、依托性、多样性、可加工性、价值易性等传统特征外,还具有规模大、更新频繁、类型多样、保密性强等特征2。1)数据规模大。铁路企业拥有规模巨大的数据,并且数量还在呈几何级数不断增长。据粗略统计,目前,铁路数据资产总量达10 PB 以上,日增长量超1 TB3。2)数据更新频繁。随着互联网技术的发展,铁路数据更新愈加频繁,成为其区别于过去的重要特征。如
10、铁路设备设施维修维护系统和生产系统产生的数据动态性强、随机性强、颗粒度多样,且都以ms或s的时间间隔变化。3)数据类型多样。铁路行业的专业类型多、业务范围广、延伸服务链长等特点造就了数据种类的多样性4。铁路数据根据产生的来源可以分为内部数据和外部数据,其中内部数据包括安全生产数据、运营服务数据、物资采购数据、财务管理数据等;外部数据包括交通路况、天气数据和其他相关公共数据等。4)保密性强。铁路数据涉及铁路日常管理、人事调动、调度安排等业务及流程5。数据如若泄露,将对企业秘密和公共安全造成极大的危害,因此对保密性要求高。1.2 铁路数据价值影响因素数据价值评估的前置条件是梳理数据价值的影响因素。
11、影响数据价值的因素通常包括数据的初始成本、类似资产的交易价格、市场应用情况、市场规模情况、市场占有率、竞争情况等6。结合铁路数据应用特点,本研究主要考虑影响数据价值的四种因素:技术因素、质量因素、应用及商业模式因素和风险因素。1)技术因素。通常包括数据获取、数据存储、数据加工、数据挖掘、数据保护、数据共享等。数据技术维度主要关注的是数据的产生、管理、存储等方面的成本。2)质量因素。通常包括数据完整性、数据规范性、数据准确性、数据可靠性等。数据质量维度是数据管理从业者基于已有的一些标准用来评估和衡量数据质量的一个特征方面,是数据的本质属性之一。3)应用及商业模式因素。通常包括数据的规模性、关联性
12、、流通性、稀缺性、增值性等。数据因其应用领域、使用方法、获利方式的不同,会造成价值显著差异。数据的商业模式主要有提供数据服务模式、数字媒体模式、数据资产服务模式、数据空间运营模式、数据资产技术服务模式等。4)风险因素。通常包括数据泄漏风险和数据贬值风险。数据泄露风险是指数据使用不当产生损害国家安全、泄露商业秘密、侵犯个人隐私的风险。数据贬值风险指因新技术的推广和运用造成原有数据的技术落后、性能降低的功能性贬值和因宏观经济、政策环境变化造成的数据不能继续有效使用或者有效使用的范围减小的经济性贬值。2铁路数据价值指标体系构建2.1 数据评估方法目前,国内外数据价值评估机构常用的方法有成本法、收益法
13、和市场法三种传统方法,不同方法的核心评估思路和使用前提如表1所示。基于上述各种方法的使用前提,研究对不同方法在铁路数据价值评估中的适用性进行了分析。收益法方面,铁路企业不是以数据相关的业务为主业,难以直接评估出数据产生的收益。市场法方面,目前国内的数据交易市场发育尚不完善,难以找到与铁路数据相关的市场交易案例。因此,在铁路数据资产价值评估中不具备使用收益法和市场法的条件。考虑到以上评估方法的使用条件和铁路数据的保密性、成本可获得性等特征,本研究选择成本法作方法成本法收益法市场法核心思路通过归集数据产生、存储、管理等历史成本,进而确定被评估资产的价值通过预测评估资产未来的收益,进而确定被评估资产
14、的价值通过比较被评估资产与最近售出类似资产的异同,进而确定被评估资产的价值使用前提能够准确、客观地归集出数据全周期成本能够准确、客观地预测出铁路数据的收益能够找到与被评估资产相同或相类似的参照物,且参照物及其与被评估资产可比较的指标、技术参数等资料可搜集到表1 评估方法核心思路及使用前提铁路数据价值评估方法初探丁传琛172023年第4期 总第174期为基础评估方法。但是,由于成本法自身存在弱相对性的短板,不能体现数据应用和增值的价值,本研究在传统成本法的基础上融入收益法和市场法的思路,进而形成改进成本法,具体形成思路如图 1所示。2.2 指标体系构建结合上文形成的改进成本法,研究以系统性、典型
15、性、独立性、动态性、可操作性原则为指引,并结合铁路数据特点和数据价值影响因素构建了包括成本价值、标的价值指数、增值价值指数的指标体系,其中每项指标下面涵盖多项次级指标,具体如图2所示。3铁路数据价值评估方法研究本研究在综合考虑基础成本法理论模型和铁路数据特征的基础上,通过增加标的价值指数和增值价值指数形成了改进成本法,构建的铁路数据价值评估模型如下:P=TC(1+U)(1+T)(1)式中:P为铁路数据价值评估值;TC为成本价值;U为标的价值指数;T为增值价值指数。3.1 数据成本价值计算数据成本价值涵盖建设成本、运维成本和管理成本,需从数据的采集到应用整个生命周期中归集出总成本。在理论层面,数
16、据成本一般有按财务核算口径分类和按功能分类两种(见图3)。但在实际中,数据的历史总成本较难完整归集,实际操作困难,尤其是铁路这种不以数据为主业的行业,更是难以归集出数据成本。可获得数据成本依托应用系统铁路数据属性基本方法基本成本法收益法和市场法的思路大多铁路系统/数据不产生市场经济效益市场缺少同类型交易案例基于AHP-模糊综合评价法的互联网企业数据资产评估研究专用性强市场空白文献标准指南研究方法案例分析改进成本法GB/T 37550-2019电子商务数据资产评价指标体系资产评估专家指引第9号数据资产评估数据资产评估指南商业银行数据资产估值白皮书光大银行数据资产估值无形资产评估案例城市数字经济发
17、展论坛问题:市场交易量较少前提:同类型案例类比问题:不可预测、分劈前提:需预测未来收益前提:需获得成本问题:成本不能反映价值成本法市场法收益法图1 铁路数据价值评估方法形成思路图2 铁路数据价值指标体系铁路数据价值成本价值标的价值指数增值价值指数建设成本运维成本质量维度管理成本风险维度应用维度使用对象使用场景使用条件使用领域使用方式路外对象路内对象贬值风险安全风险关联性规模性可访问性精细度时效性一致性规范性完整性人力成本服务外包间接成本数据规划数据采集数据核验数据标识数据维护数据整合数据存储设备折旧铁路数据价值评估方法初探丁传琛18数据具有明显的依托性,不独立产生也不独立存在,本研究中铁路数据
18、也依托铁路应用系统,是其中的重要组成部分。考虑到数据历史成本归集操作性较差和系统研发、运维经费的可获得性,研究以待评估数据依托应用系统的建设费用和运维费用的一部分作为数据的成本价值。经与业内专家座谈分析,研究取50%的研发经费和70%的运维经费作为数据成本价值。具体公式如下:TC=i=1n(0.5Pd+0.7Po)*Si(2)式中:Pd为系统研发投入;Po为系统运维投入;S表示重置系数;i表示评估年。3.2 标的价值指数计算标的价值指数U是数据在其自身质量、应用效果、风险程度等方面的综合反映,从自身属性的角度影响数据价值,通过所属指标权值和指标分值计算获得,计算公式如下所示:U=WU1*i=4
19、7WUiUi+WU2*i=811WUiUi+WU3*i=1213WUiUi(3)式中:Ui为标的价值指数所属指标分值;WUi为指标Ui对应的权重。3.2.1指标权值计算3.2.1.1构建判断矩阵本文将标的价值指数分为评估指标层、第一级指标层、第二级指标层。邀请专家对同一准则下的指标xi与xj成对比较,用1-9标度法表示两者之间的重要程度,记为aij。从而建立判断矩阵,合成判断矩阵A=(aij)nn。3.2.1.2层次单排序和矩阵一致性检验第一步,将前文定义的判断矩阵A按照矩阵的列正规化:-aij=aiji,j=1ndij,其中 i,j=1,2,3,.,n,得到正规化后的矩阵A。第二步,计算出矩
20、阵A的各行和的平均值,得到影响数据价值的各个因素的权重指标:Wi=1ni,j=1n-dij,其中 i,j=1,2,3,.,n,得到 W=w1,w2,w3,wnT。第三步,计算判断矩阵A的最大特征值:max=i=1n(AW)inwi,式子(AW)i代表向量AW的第i个标度值135792,4,6,8倒数含义一个因素和另一个因素同等重要一个因素比另一个因素比较重要一个因素比另一个因素明显重要一个因素比另一个因素非常重要一个因素比另一个因素绝对重要相邻元素的中间值aij=1/aji表2 判断矩阵标度及其含义按财务核算口径分类按功能分类主要与数据的取得方式有关,包括内部生产运营过程获取的数据、间接调研方
21、式采集取得的数据,以及通过外购方式获取的数据等数据处理、加工阶段的成本,与数据处理流程有关。包括数据核验、数据预处理和数据分析挖掘相关的成本数据储存、介质阶段发生的成本,与存储方式有关。主要分为自有服务器与云端存储涉及数据资产整个生命周期数据安全相关的成本投入,以及为保证数据资产系统安全、可靠运行进行的相关维护,更新方面的支出取得成本加工成本设备及存储成本安全、维护及更新支出间接成本选择合理的分配标准分配计入不同的成本核算对象直接成本直接计成本核算对象的相关成本核算项目图3 数据成本价值构成铁路数据价值评估方法初探丁传琛192023年第4期 总第174期分量。第四步,进行一致性检验,分析是否可
22、以运用层次分析法:首先计算出该层次分析的一致性指标 CI=max-nn-1,然后计算随机性一致检验指标:CR=CIRI,最后判断矩阵D是否通过一致性检验,其中RI为平均随机一致性指标,具体如表3所示。本研究中的CR0.1,通过一致性检验。3.2.1.3指标权重计算研究基于构建的数据价值评估模型和标度理论,邀请15位相关领域专家分别对一级和二级指标进行打分,其中5名铁路领域专家,5 名资产评估领域专家,5名计算机领域专家,最后根据专家打分的平均分计算出指标权重,如表4所示。3.2.2指标分值计算标的价值指数所属各项指标的分值可通过公式计算和专家打分获得,其中指标的计算方法通过有关标准和铁路数据特
23、征确定,如表5所示。nRI102030.5840.9051.1261.2471.3281.4191.45表3 RI值查询一级指标铁路数据标的价值指数U二级指标质量价值U1应用价值U2数据风险U3权重0.320.560.12三级指标完整性U4规范性U5一致性U6时效性U7精细度U8可访问性U9规模性U10关联性U11安全风险U12贬值风险U13权重0.160.410.170.260.250.350.230.170.750.25表4 标的价值指数指标权重表5 标的价值指标分值计算7质量价值U1应用价值U2完整性U4规范性U5一致性U6时效性U7精准度U8可访问性U9按照业务规则要求,数据集中元素和
24、记录应被赋值的数据元素的赋值程度以国际标准、国家标准、行业标准、地方标准或相关规定等为基础,评价数据的命名、取值范围、类型、计量单位、隐私保护等是否符合要求同一数据在不同位置存储或被不同应用或用户使用时,数据的一致性;数据发生变化时,存储在不同位置的同一数据被同步修改基于时间戳的记录数、频率分布或延迟时间符合业务需求的程度符合客观实际和业务应用需求的程度数据集中请求访问成功的元素数量与请求访问元素总数量之比X=A/BA=数据集中被赋值的元素个数;B=数据集中应被赋值的元素总数X=A/BA=数据集中满足标准规范要求的元素个数;B=数据集元素总数X=A/BA=数据集中满足一致性要求的元素个数;B=
25、数据集元素总数X=A/BA=数据集中满足时效性要求的元素个数;B=数据集元素总数X=A/BA=达到精准性和精度要求的数据元素个数;B=数据集元素总数X=A/BA=数据集中请求访问成功的元素数量;B=数据集请求访问元素总数量二级指标三级指标指标描述计算方法铁路数据价值评估方法初探丁传琛203.3 增值价值指数计算增值价值指数T是数据在其使用对象、使用条件、使用场景等方面的综合反映,从使用的角度影响数据价值,通过所属指标权值和指标分值计算获得,计算公式如下所示:T=WT1*i=45WTiTi+WT2*WT6T6+WT3*WT7T7(4)式中:Ti为标的价值指数所属指标分值;WTi为指标Ui对应的权
26、重。3.3.1指标权值计算指标权值计算的步骤与标的价值指数一致,计算结果如表6所示。3.3.2增值价值指数计算增值价值指数所属各项指标的分值可通过指标评分标准和专家打分获得,其中评分标准根据国铁数据风险U3规模性U10关联性U11安全风险U12贬值风险U131.数据的规模体量;2.某数据中结构化数据占总数据量的程度数据间的关联程度,从数据所在系统跨级关联和同级关联数量来衡量数据在使用过程中泄露、被篡改、损毁等风险数据在使用过程中因内外部原因造成的价值减少X=(X1+X2)/2规模1 TB(0.7X11)1 GB规模1 TB(0.3X10.7)规模1 GB(0X10.3)X2=A/BA=结构化数
27、据体量;B=被评价的总数据体量跨级5(0.8X 1)1跨级5(0.6X0.8)同级10(0.4X0.6)5同级10(0.2X0.4)同级5(0X0.2)X=X1+X2+X3+X4管理风险(0X10.25)失真风险(0X20.25)监管风险(0X30.25)流通风险(0X40.25)X=X1+X2功能性贬值(0X10.5)经济性贬值(0X20.5)续表二级指标三级指标指标描述计算方法应用价值U2注:X越接近1越好(0X1)表6 增值价值指数指标权重一级指标铁路数据增值价值指数T二级指标使用对象T1使用条件T2使用场景T3权重0.110.260.63三级指标路内对象T4路外对象T5使用方式T6使用
28、领域T7权重0.30.711铁路数据价值评估方法初探丁传琛212023年第4期 总第174期集团文件和专家经验获得,如表7所示。4案例分析研究以2013年上线运行的某铁路信息系统为案例进行计算。首先,统计信息系统历年研发、运维的历史成本,共计1 437万元。然后,通过历年的历史成本乘以对应投入年的重置系数得到重置成本。考虑到IT行业人员工资增长、系统功能性贬值、系统经济性贬值等影响重置成本的因素存在增减互抵的关系,指南仅取物价重置系数作为重置成本系数,物价重置系数选取统计周期内的年平均CPI,根据数据成本价值的计算公式,可计算出此系统中的数据成本价值为996.07万元,具体如表8所示。一级指标
29、铁路数据增值价值指数T二级指标使用对象T1使用条件T2使用场景T3三级指标路内对象T4路外对象T5使用方式T6使用领域T7指标描述国铁集团系统内的铁路企业国铁集团系统外的企业提供数据服务的方式用数据所在七大业务领域系统来衡量数据的可使用领域评分标准铁路运输类(0X0.5)铁路经营保障类(0.5X0.8)铁路关联市场产业类(0.8X1)其他类(0X0.5)X=1API(0.8X1)数据集合(0.4X0.8)数据报告(0X0.4)战略决策类系统(0X0.4)经营开发类系统(0.4X0.7)运输生产类系统(0.7X1)资源管理类系统(0X0.4)建设管理类系统(0.4X0.7)综合协同类系统(0X0
30、.4)平台类系统(0.7X1)统计周期2022202120202019201820172016201520142013总计历史物价增长率102.00%100.90%102.42%102.90%102.07%101.59%102.00%101.44%101.92%物价重置系数1.001.021.031.051.081.101.121.141.161.18研发历史成本540.00540.00研发重置成本637.20637.20运维历史成本100.00112.0094.0091.0090.0089.00102.00109.00110.00897.00运维重置成本100.00114.2496.8295
31、.5597.2097.90114.24124.26127.60967.81表7 标的价值指标分值计算注:X越接近1越好(0X1)表8 20132022年重置系数统计表铁路数据价值评估方法初探丁传琛22一级指标铁路数据标的价值指数U铁路数据增值价值指数T二级指标质量价值U1应用价值U2数据风险U3使用对象T1使用条件T2使用场景T3权重0.320.560.120.110.260.63三级指标完整性U4规范性U5一致性U6时效性U7精细度U8可访问性U9规模性U10关联性U11安全风险U12贬值风险U13路内对象T4路外对象T5使用方式T6使用领域T7权重0.160.410.170.260.250
32、.350.230.170.750.250.30.711指标取值0.830.730.650.780.900.930.450.470.540.670.781.000.760.85结合待评估数据和每项指标的计算方法来确定三级指标的分值,进而结合指标权重求得U为0.72、T为0.84,具体计算如表9。综上,将数据成本价值、标的价值指数和增值价值指数带入到模型后得到数据价值评估结果为3 152.35万元,为数据成本的3倍左右,可作为下一步数据定价的基础。5结语随着数据被纳入生产要素范围和数据量指数级的增长,其在铁路领域的作用日益增强。研究在构建数据价值指标体系的前提下,形成了以成本法为基础,融入收益法和
33、市场法逻辑思路的改进成本法,并利用层次分析法、指标计算法、专家打分法进行了估值计算。下一步,课题组将在铁路数据价值评估的基础上,结合市场化等因素进一步优化模型参数,探索数据定价方法。参考文献1 王同军.中国铁路大数据应用顶层设计研究与实践J.中国铁路,2017(1):8-16.2 马小宁,邹丹,吴艳华.铁路主数据管理平台解决方案及应用实践J.中国铁路,2017(1):17-23.3 吴江,马小宁,邹丹,等.基于AHP-FCE的铁路数据资产价值评估方法J.铁道运输与经济,2021,43(12):80-86.4 闻克宇,王龙.大数据环境下铁路运营数据资产价值分析与展望J.铁道经济研究,2018(3):32-34.5 马长青.关于利用最小颗粒度数据编制集团公司年度运输生产计划的研究J.铁道经济研究,2020(1):34-38.6 中国资产评估协会.资产评估专家指引第9号数据资产评估(中评协 2019 40号)S.2019.7 电子商务数据资产评价指标体系:GB/T375502019S.2019.(责任编辑:魏艳红)(修回日期:2023-07-18)表9 标的价值指数U和增值价值指数T计算实例铁路数据价值评估方法初探丁传琛23