1、前 言习近平总书记指出,要构建以数据为关键要素的数字经济。党的十九届四中全会首次增列“数据”作为生产要素,中国成为首个将数据作为生产要素的国家。随着关于构建数据基础制度更好发挥数据要素作用的意见的发布和国家数据局组建,“数据要素”三年行动计划(2024-2026年)等10余项政策文件陆续印发,我国数据要素化进入新阶段。数据感知采集出现新技术、数据基础设施产生标准化新需求、数据交易机构打开新局面、公共数据启动授权运营、数据开发利用涌现新模式、数据服务商形成新业态、数字化转型大规模铺开,数据生产存储、流通交易、开发利用的各个环节产生新变化,亟需构建一套新的调查方法和指标体系,来全面摸底我国数据资源
2、发展情况。2024年2月,国家数据局联合中央网信办、工业和信息化部、公安部组织开展全国数据资源调查,国家工业信息安全发展研究中心承担调查实施工作。在前期工作基础上,此次调查扩大调查范围、扩展调查对象、增设调查指标,通过全量测算和抽样调查等方式,调查全国关键数据资源情况,为政府施策、产业发展提供参考。调查发现,我国数据资源“产-存-算”规模优势基本形成,数据“供给-流通-应用”主体逐渐丰富,海量数据和丰富场景优势潜力亟需释放,数据资源管理和利用整体处于起步阶段。一是数据生产总量大,但有效供给不足。2023年,数据生产总量1达32.85泽字节(ZB),同比增长22.44%。5G、AI、物联网技术的
3、创新发展及智能设备的规模应用,推动数据生产规模快速增长。2023年,全国数据存储总量2为1.73泽字节(ZB),新增数据存储量3为0.95泽字节(ZB),生产总量中2.9%的数据被保存。存储数据中,一年未使用的数据占比约4成,数据加工能力不足导致大量数据价值被低估、难以挖掘复用。1 全国数据生产总量指2023年全国数据创建、复制、捕获和消费产生的数据总量。2 全国数据存储总量指全国累计存储的数据量,包括算力中心存储量,以及政府、企事业单位、个人终端的数据存 储量。3 当年新增数据存储量包含当年新增存储设备的存储量,以及既有设备中被当年数据覆盖的数据量。二是算力存力较合理,还需适度超前布局。20
4、23年,全国2200多个算力中心的算力规模约为0.23十万亿亿次浮点运算/秒(ZFLOPS),同比增长约为30%;全国数据存储总空间4为2.93泽字节(ZB),存储空间利用率5为59%。随着大模型研发应用不断增加,对存力、算力提出更高要求,需保持适度超前布局。三是数据流通交易需求旺盛,多元流通模式待完善。2023年,全国数据总流量同比增长7.6%,消费领域数据交互活跃度较高。中央企业6和平台企业7发挥行业枢纽作用,探索数据交互机制。数据交易机构建设加速,场内交易活跃度较低,产品成交率为17.9%。数据供给难以满足旺盛需求,急需建立和完善多元流通模式。四是数据应用场景加速落地,数据价值有待释放。
5、公共数据成为引领数据开发利用的催化剂,公共数据开放量同比增长超16%,授权运营初步探索。数据多场景应用、多主体复用难度大,96%的行业重点企业8已实现数据场景化应用,但实现数据复用增值的大企业9仅占8.3%,数据价值有待释放。全国数据资源调查工作验证了我国发展数字经济具备超大规模市场、海量数据资源和丰富应用场景优势。未来,随着数据技术不断进步,基础制度持续完善,数据生产规模将保持高速增长,存储计算将向按需调度发展,数据流通将向规范有序、多元协同发展,数据开发利用将向需求牵引、智能驱动发展。报告研究时间较短,不足之处在所难免,敬请各位专家和广大读者指正。4 数据存储空间包括全国算力中心的存储空间
6、,以及政府、企事业单位、个人终端的存储空间。5 存储空间利用率=累计数据存储总量/累计数据存储总空间。6 本报告提到的中央企业,有效样本数量为94家。7 本报告提到的平台企业,有效样本数量为354家。8 本报告提到的行业重点企业为东部地区百强企业,中部地区80强企业和西部地区50强企业,有效样本企业数量1202家,不含94家中央企业和768家数据服务商。9 按照 统计上大中小微型企业划分办法(2017)(国统字 2017 213号)对行业重点企业中的大中小型企业进行划分,报告中的大企业为统计上大型企业。目录CONTENTS一、调查结果(一)一组数据:数据“产-存-算”规模优势基本形成(二)一批
7、成效:数据“供给-流通-应用”主体逐渐丰富(三)一些问题:海量数据和丰富场景优势潜力仍待释放二、工作方法(一)数据来源(二)调查方法(三)结果校验三、结果分析(一)数据生产规模大,范围广,增长速度快(二)数据存储空间合理,终端存储高于云存储,产存转化待提升148223577910(三)算力规模增长快,区域算力按需布局,智算能力需求旺(四)数据流通方式多元,交互能力有提升,交易供需不均衡(五)公共数据开放共享初见成效,授权运营起步探索,政企数据融合不断深入(六)数字化转型激活企业数据,场景应用提质增效,数据外溢效应仍不足 四、发展趋势(一)数据生产向高增速和高质量同步发展(二)数据存储计算向一体
8、化按需供给发展(三)数据流通向规范有序、多元协同发展(四)数据应用向需求牵引、智能驱动发展附录1111141619222020202101 一、调查结果调查发现,我国数据资源管理和利用整体处于起步阶段,数据“产-存-算”规模优势基本形成,数据“供给-流通-应用”主体逐渐丰富,海量数据和丰富场景优势潜力仍待释放。数据作为新型生产要素,具有重要基础性和战略性,是发展新质生产力的重要基础。近年来,在政产学研用合力推动下,我国数据规模实现快速增长,数据流通交易架构逐步形成,数据开发利用创新探索,数据要素价值加快释放,为做大做强数字经济、建设数字中国奠定了坚实基础。02 全国数据资源调查报告(2023年
9、)(一)一组数据:数据“产-存-算”规模优势基本形成(二)一批成效:数据“供给-流通-应用”主体逐渐丰富全国数据生产、存储、计算呈现规模大、增速快的特点。2023年,全国数据生产总量达到32.85泽字节(ZB),同比增长22.44%。2023年,全国数据存储总量为1.73泽字节(ZB),存储空间利用率为59%。2023年,2200多个算力中心的算力规模超0.23十万亿亿次浮点运算/秒(ZFLOPS),同比增长约30%。其中,智能算力占比约30%。数据要素市场化进程中,各类主体不断涌现,为数据“供给-流通-应用”提供有力支撑。2023年,全国一体化政务数据共享枢纽接入53个国家部门、31个省/自
10、治区/直辖市和新疆生产建设兵团数据,“一网通办”事项不断增加。2023年,公共数据开放量同比增长超16%。18.6%的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。2023年,4个国家部门、15个省级数据管理部门探索公共数据授权运营。(三)一些问题:海量数据和丰富场景优势潜力仍待释放数据生产存储、流通交易、开发利用过程中的数据量降幅较大,能支撑人工智能训练的数据资源较少,数据价值仍需进一步挖掘。03 全国数据资源调查报告(2023年)10 产存转化率=当年新增存储数据量/当年生产数据量。2023年,全国数据产存转化率10为2.9%,海量数据源头即弃。2023年,企业一年未使
11、用的数据占比为38.93%,大量数据被存储后不再被读取和复用。2023年,交易所需求方是供给方的1.75倍,数据产品成交率为17.9%,数据场内交易供需匹配率低。2023年,尚未建设数据管理系统的大企业比例为21.9%,实现规划管理的数据资源仍然较少。2023年,开展数字化转型的大企业中,实现数据复用增值的仅有8.3%,数据价值挖掘任重道远。04 二、工作方法近年来,数据资源的基础作用日渐凸显,正在激发数据产业创新活力,不断赋能经济社会高质量发展。2024年2月,为适应数据要素化市场配置改革形势,更好分析我国数据资源结构、利用情况和存在问题,国家数据局、中央网信办、工业和信息化部、公安部四部门
12、发布关于开展全国数据资源调查的通知,面向政府部门、高校、协会以及重点企事业单位开展调查。国家工业信息安全发展研究中心在原有工作基础上进行了优化调整,借鉴国际相关机构调查方法,设立了“指标体系-采集机制-分析测算-结果论证”调查方法体系,以期更加充分反映我国数据资源全貌。05 全国数据资源调查报告(2023年)(一)数据来源本次全国数据资源调查以人、机、物广泛连接产生的电子化数据为调查对象,涵盖数据生产存储、流通交易、开发利用和安全管理全生命周期。在调查项目上,强化对数据资源活跃度、应用场景、投入产出等方面的调查分析。本次全国数据资源调查标准时点为2023年12月31日,调查结果中的全国数据不包
13、含香港、澳门和台湾地区数据。数据生产和数据存储两项指标综合国外专业机构研究方法、国内相关专家论证,经过全国22个行业协会推荐,设定数据生产存储样本库。数据生产主要来源各类主体在生产生活、交通运输、物联感知、生产制造、数据处理领域,创建、复制、捕获和消费产生的数据总量。数据存储主要来源各类存储介质的数据记录和保存总量,以及各类存储介质的存储容量。表2.1 2023全国数据资源调查有效样本说明序号名称样本说明1数据生产根据主要数据生产/采集设备及系统软件等厂商和协会数据,测算全国数据生产总量。2数据存储根据主要数据存储介质厂商和协会数据,测算全国数据存储总量。3数据计算来自2200多个算力中心的数
14、据。4数据流通来自四大运营商、27家数据交易所的数据。5数据应用来自全国29个国家部门、31个省/自治区/直辖市、5个计划单列市、33家重点高校、14个国家科学数据中心、27家数据交易所、10个国家实验室和2064家样本企业(含94家中央企业和354家平台企业)的数据。06 全国数据资源调查报告(2023年)表2.2 数据产生和存储样本情况序号数据产生和存储分类1人生产生活包含手机、PC、智能家居、可穿戴设备等2交通运输包含火车、飞机、船、智能汽车等3物物联感知包含监控设备、仪器仪表、传感器等4生产制造包含边缘智能设备、工业机器人、数控机床等5机存储计算包含服务器、内存、硬盘等6软件系统包含资
15、源管理系统、研发设计软件等数据计算主要来源于2200多个算力中心数据资源调查信息,涵盖通用计算中心、智能计算中心和超算中心。数据流通主要来源于四大运营商和27个数据交易所数据,覆盖数据交互和交易情况。数据应用主要来源于中央企业、数据服务商和行业重点企业共计2064家有效样本企业,以及重点高校、国家实验室、国家科学数据中心等数据。07 全国数据资源调查报告(2023年)(二)调查方法本次全国数据资源调查方法主要采用全量数据测算和抽样数据调查两种方式。数据生产和数据存储数据结果采用全量测算模型,应用龙头企业和行业协会数据设置模型参数,测算结果反映总体情况。数据计算、数据流通、数据应用3项指标采用抽
16、样调查方式。对样本单位数据进行梳理、计算后得出调查结果。(三)结果校验针对数据结果开展三次校验。一是数据之间校验,在数据各环节主体信息开展交叉验证,如协会与设备厂商、云服务商与算力中心等。二是数据结果与国内外研究机构数据校验,如国际数据公司、中国社会科学院等相关报告结果进行交叉验证。三是数据结果专家论证,开展八轮专家论证会,邀请20多位数据领域专家论证数据可靠性。表2.3 数据应用样本情况序号分类1政务数据国家部门2省级数据主管部门3计划单列市数据主管部门4科研数据高校5国家实验室6国家科学数据中心7企业数据中央企业8数据服务商平台企业9其他企业10行业重点企业农业11工业12金融13交通物流
17、14消费民生15科教文卫16公共服务08 三、结果分析我国数据产量、存量、算力规模大,数据流通、交易变化快,公共数据开放共享授权运营加快探索,企业数据多场景落地,为构建数据要素市场提供了坚实基础。09 全国数据资源调查报告(2023年)(一)数据生产规模大,范围广,增长速度快我国数据生产规模持续扩大。2023年数据生产总量达到32.85泽字节(ZB),同比增长22.44%,非结构数据爆发式增长。随着5G、AI技术的快速发展及智能设备的规模应用,内容创作、影像视听等非结构数据对我国数据总规模增长贡献较大,消费民生领域新业态不断涌现,满足了人们不断增长的文化娱乐消费需求。智慧城市扩大物联感知范围。
18、公共数据获取范围不断扩大,设施物联传感数据占比超40%。城市各种基础设施、资源、服务等加速数字化、网络化、智能化升级,摄像头、传感器、无线设备等相互连接形成城市的“神经脉络”,实时捕捉城市交通、人流等各种信息,推动海量数据从大街小巷汇入城市大脑。图3.1 数据来源分布情况数据来源:2023年全国数据资源调查10 全国数据资源调查报告(2023年)(二)数据存储空间合理,终端存储高于云存储,产存转化待提升存储总空间基本满足存储需求。2023年我国累计数据存储总量为1.73泽字节(ZB),存储空间利用率为59%。其中政府和行业重点企业存储空间利用率均为70%左右。数据服务商对存储空间提前布局,存储
19、空间利用率为35.29%。随着企业算力的不断提升,对数据存储除性能要求外,更需高扩展性来为海量数据“矿产”的挖掘做准备。数据终端存储高于云存储。数据云存储占比11约超过40%,其中,行业重点企业云存储占比12为23.49%。云存储高灵活性和高便捷性优势有效支撑了业务协同带来的数据交互需求。行业重点企业数据终端存储占比超七成,海量数据被分散存储,数据互联、复用难度较大,但边缘智能化一定程度上能促进数据从存向用转化。数据产存转化率较低。2023年新增数据存储量为0.95泽字节(ZB),与年数据生产总量相比,占比为2.9%,数据价值潜力有待进一步挖掘。一方面海量数据复用价值较低,大部分过程类数据产生
20、后即被丢弃、覆盖。另一方面大模型、训练工具等支撑能力不足,海量数据开发利用价值低于存储成本,部分高价值数据在“大浪淘沙”过程中被遗弃。11 数据云存储占比=全国2200多个算力中心的数据云存储量/全国数据存储量。12 行业重点企业云存储占比=企业云存储数据量/企业数据存储总量,有效样本来源为1202个行业重点企业。智能应用推动数据产量提速。随着技术的创新突破以及硬件的迭代更新,生产生活的数字化应用逐渐增加,推动我国数据产量快速增长。在生活方面,智能网联车驱动车、路、网、云数据快速交换,出行数据同比增幅达到49%。在生产方面,老旧生产设备的升级改造以及智能边缘设备、工业机器人、数控机床等智能设备
21、的推广应用,推动生产制造数据同比增幅达到20%。11 全国数据资源调查报告(2023年)(三)算力规模增长快,区域算力按需布局,智算能力需求旺算力中心规模持续增长,算力建设仍需适度超前布局。至2023年底,2200多个算力中心的算力规模约为0.23十万亿亿次浮点运算/秒(ZFLOPS),同比增长约为30%。与此同时,大模型训练算力需求高涨13,科学、政务、金融、工业等行业算力需求随之增加,一体化算力体系建设仍需加快推进,保持适度超前布局。区域算力按需布局,东西部算力协同仍待发展。一方面,算力枢纽按需布局趋势明显。东部地区实时计算需求增幅较大,实时数据处理仍依赖于本地算力。京津冀、长三角、珠三角
22、地区算力规模占比达58.61%。另一方面,东数西算仍需进一步发展。西部地区凭借绿色化和低成本的算力优势逐步承接东部计算需求。如影视制作企业、云服务商等借助西部算力中心大幅缩减成本。然而西部地区存算利用率仍然低于东部地区。大模型需求不断增加,智算支撑能力仍需提升。至2023年我国智能算力占比约为30%,各行业各领域对智能算力的需求日趋强烈,而能够支撑行业垂直领域大模型落地的算力不足,大模型与国产软硬件的适配性问题尚需解决。(四)数据流通方式多元,交互能力有提升,交易供需不均衡13 英伟达预测Transformer大模型训练算力需求将以275倍/两年的速度增长。14 企业数据交互量=数据流入量+数
23、据流出量。消费领域数据交互活跃度较高。2023年,四大运营商数据显示全国数据总流量较去年同期增长7.6%,数据流量保持稳步增长。随着汽车、家居、穿戴等智能终端品类不断丰富和声像视听数据交互需求持续增加,移动互联网数据流通活跃度不断增加。平台和央企数据流通量远超其他企业。中央企业和平台企业成为行业领域的数据枢纽,在各自领域探索交互机制。平台企业是行业领域的数据枢纽。本次调查中,平台企业平均数据交互量14为行业重点企业的249倍,各行业数据正逐渐向平台12 全国数据资源调查报告(2023年)聚拢。SaaS服务模式日益成熟,平台提供数据产品中SaaS化产品占比超五成,订阅式交易占比逐年增多。中央企业
24、成为产业链数据枢纽。本次调查中,中央企业平均数据交互量为行业重点企业的42倍。链主企业正在通过产业链协同赋能上下游企业,汇聚全产业链数据。交易机构加快建设,场内交易吸引力不足。全国各地交易所快速铺开,19个省市建立数据交易机构。上海、浙江、深圳、海南等地数据交易机构“百花齐放”,交易模式、数商生态、技术底座各具特色。交易机构在标准、规则方面尚未达成共识,场内交易吸引力不足。数据交易机构供给水平难以满足旺盛的数据需求。数据需求快速增长,制造业、信息服务、批发零售等行业数据需求量较大。与此同时,交易机构数据产品成交率不高。27家交易所上架数据产品中仅有17.9%实现交易,数据场内交易活跃度较低。例
25、如,消费民生领域数据产品购买方数量是供给方的2.4倍,但产品成交率不足一成,存在供需不匹配的现象。图3.2 场内数据交易额行业15分布情况数据来源:2023年全国数据资源调查15 信息服务主要包含信息传输软件和信息技术服务业等。公共服务主要包含水利环境和公共设施管理业、公共管理社会保障和社会组织等。金融主要包含金融业等。科教文卫主要包含科学研究和技术服务业、教育、文化体育和娱乐业、卫生和社会工作等。消费民生主要包含批发和零售业、住宿和餐饮业、租赁和商务服务业、居民服务修理和其他服务业等。交通运输主要包含交通运输仓储和邮政业等。工业主要包含采矿业、制造业、电力热力燃气及水生产和供应业、建筑业等。
26、农业主要包含农林牧渔业等。13 全国数据资源调查报告(2023年)以湖南大数据交易所为载体,以产业场景数据为抓手,加强数据安全保障,充分释放数据要素价值,探索出一条以产业思维推动数据流通交易的创新路子。以产业思维,建好湖南数交所,形成“产业园区赋能、行业龙头带动、市州共建共赢”的湖南方案。一方面以园区为土壤赋能数据交易场所运营发展。另一方面以行业头部企业带动“数据四要素”集聚。上线数据交易母平台1.0版,在交易牌照基础上,完成省市两级数据登记资质。截至目前,数交所发展数商会员单位433家,上架数据产品3859个,交易额突破12亿元。以产业场景应用为导向,加快重点行业数据有序流通交易,有效释放数
27、据要素价值。对典型应用场景进行需求开发,促进形成新的区域产业增长极。在数据要素x“文化+科技”领域,马栏山承接了全网80%头部综艺节目及全国30%的3D动画制作,其建设的“云、网、算”统一服务平台,将超高清视频处理速度提升100倍,推动影视内容制作全链条产品升级换代,助力湖南以“内容数据”为核心的音视频产业成为世界一流,并产生多项领先技术标准。在数据要素x工业制造领域,建立数据可信流通体系,促进数据在龙头企业和上下游企业间安全流通,实现以数据提升整个产业链的生产效率。中科云谷打造的端对端数字化协同平台,有效支撑企业研发周期缩短30天,生产效率提升20%,供应商交付准时率提升10%,设备使用效率
28、提升10%,运营成本降低10%。在数据要素x现代农业领域,通过搭建农业产业数字化服务平台,实时采集超4500万用户、4250多种农产品类目,对累计52+亿条源数据的交易数据进行分析挖掘,打造以电商数据为主的“惠农大数据”,为政府、高校、企业等上千家单位提供数据产品或数据服务,带动农产品交易540多亿元。单位名称:湖南省数据局典型做法以产业思维推动数据流通交易高质量发展14 全国数据资源调查报告(2023年)公共数据体系完善,数据汇聚能力不断提升。截至2023年12月底,全国一体化政务数据枢纽接入53个国家部门、31个省/自治区/直辖市和新疆生产建设兵团数据,挂接资源达2.06万个,实现累计调用
29、5361.35亿次服务。公共数据开放共享提升政务服务水平。国家行业主管部门、地方省级政府开放数据量比上年增长16%、18.5%。高频政务服务事项实现“一网通办”“跨省通办”,逐步向标准化服务发展,电子证照、身份识别等已实现数据全国协同。公共数据共享满足率仅在少数应用场景得到满足,但大多数需求场景暂不明确的领域,与应用解耦的基础类数据,还需进一步提升数据共享效率。公共数据授权运营机制正初步探索。人力资源和社会保障部、文化和旅游部、国家市场监督管理总局、国家卫生健康委等国家部委开展了公共数据授权运营。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索公共数据授权运营机制。公共数据应用场景
30、主要为公共服务和社会管理。公共数据与企业数据加深融合应用。公共数据在数据开发利用、流通交易中占比较大。平台企业、数据分析企业对公共数据需求高涨。本次调查中,有18.6%的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。工商、气象、交通、地理等公共数据广泛应用于数据开发利用中,成为释放数据价值的催化剂。(五)公共数据开放共享初见成效,授权运营起步探索,政企数据融合不断深入图3.3 公共数据应用场景分布数据来源:2023年全国数据资源调查15 全国数据资源调查报告(2023年)金保信公共数据授权运营案例单位名称:金保信社保卡科技有限公司典型做法金保信社保卡科技有限公司负责全国社保
31、卡服务平台的建设、运维、运营和提供用户服务,目前在优化公共服务和推动创新发展方面取得了一定成效。在优化公共服务方面,一是建设和运营全国社保卡服务平台,形成以电子社保卡为依托的社保卡线上可信身份认证体系、支付服务体系和数据融合服务体系。截至2024年一季度末,电子社保卡已上线百项全国服务、千余项属地服务,全国累计9.86亿人领用电子社保卡,累计服务近500亿次,实现“数据多跑路,群众少跑腿”。二是打造全国性一站式求职招聘平台“就业在线”,建立全国求职招聘的总枢纽、总门户。通过“智能推荐”算法模型,实现“千人千面”的人岗匹配;通过“简历核验”和“企业验真”,打造真实、可靠的求职招聘环境;通过“直播
32、带岗”和“视频面试”,实现高效的屏对屏实时沟通效果;通过“劳务对接”和“就业见习”系统,实现重点就业人群在全国范围的协调流动。在推动社会创新方面。一是面向普惠金融、保险、人力资源服务机构,以数据模型、核验评分等方式提供50余项数据服务产品,包括身份认证、模型评分、个人参保信息核验、单位信息查验、个人养老待遇测算服务等,已接入银行、消费金融、商业保险及头部互联网公司等多家机构,助力机构防范业务风险,实现数据赋能。二是进一步整合电子社保卡、就业在线等服务能力,研发金保信“HR在线”,面向中小微企业提供招聘、履历核验、考勤、薪酬绩效、电子劳动合同等一体化SaaS平台服务,已有千余家中小微企业注册使用
33、,帮助企业降本增效,提升运营效率,推进数字化转型。16 全国数据资源调查报告(2023年)针对零售企业面临的数据资源供给不足、数据价值挖掘不足、数据应用场景匮乏等问题,通过数字化产品、解决方案和服务促进数据生产、数据消费和数据流通,推动企业精准营销、提高运营效率和增强消费者体验。一是打造“卖力值”促进网点营销精准评估。结合某地图的位置数据与支付消费数据,全面评估各网点的实际运营状况,生成“卖力值”作为终端网点评估模型。将多数据源数据和企业自有数据进行“可用不可见”的加密融合分析,提高渠道网点效能和营销决策效率与精准度。二是建设“一盘货”模式带动业务效率提升。建设线上线下数据流通的“一盘货”模式
34、,将不同渠道的订单、销售、物流等数据打通,通过对这些数据的分析,实现统一调配库存、销量预测、智能补货,线上、线下多渠道联动,实现代理商和经销商的订单及结算从1-2天提升至2分钟;代理商库存查询不存在时间差。三是通过“扫一扫”助力消费者场景建设。通过瓶盖扫码、微信小程序等端口,企业利用D2C功能搭建以及相关的多重营销活动,与第三方合作伙伴合作,将相关数据汇总到数据中台和CRM系统内,通过数据治理,建设了6大主题场景、24个一级场景、60个二级场景和280个业务指标。数字化转型沉淀海量数据,数据应用场景加速落地。随着数字化转型深入推进,企业获取数据的能力显著提升。企业积极开展数据应用,海量数据加速
35、融入生产运营各类场景。本次调查中,96%的行业重点企业已实现数据场景化应用,其中超8成行业重点企业已经运用数据辅助运营管理优化,半数企业在生产环节实现数据驱动。(六)数字化转型激活企业数据,场景应用提质增效,数据外溢效应仍不足跨产业数据融通赋能商贸零售精准营销单位名称:瓴羊智能科技有限公司典型做法17 全国数据资源调查报告(2023年)数据管理和复用水平较低,多主体数据协同难度大。企业普遍重数据设施和项目建设、轻数据资源管理,本次调查中,21.9%的大企业尚未建设数据管理系统,大多数中小企业数字化转型产生的数据未实现复用。数据多场景、多主体协同难度大。本次调查中,开展产业链协同应用的企业占比不
36、足20%,通过产业链数据实现风险预测的应用占比约为10%。企业数字化投入较高,数据价值外溢效应尚不明显。我国企业数字化投入积极性较高。本次调查中,2023年有数字化投入的行业重点企业占比超8成。企业对数据价值认识和判断不足,数据增值的投入和能力有限,开展数字化转型的大型行业重点企业中,仅有8.3%实现了数据复用增值,数据价值有待进一步释放。图3.4 数据应用场景分布数据来源:2023年全国数据资源调查18 全国数据资源调查报告(2023年)围绕盘资源、强治理、推共享、促赋能等重点方面,不断夯实数据管理与应用基础,发挥数据要素“乘数效应”。一是构建数据“一张图”,开展数据资源盘点,建立覆盖源端系
37、统和数据中台的企业级数据资源目录,动态跟踪各系统数据表结构变更情况,实时呈现数据流向情况,实现公司数据资源可视可查。二是推行数据“主人制”,强化数据治理,聚焦企业级、高价值、高共享的基础数据,落实数据定源定责,认定发布数据主人43万,推动数据工单直达数据主人,实现“管业务必须管数据,管数据就是管业务”。三是负面清单“最小化”,推动数据共享流通,推进全量数据汇聚至企业中台,健全基于负面清单的数据共享机制,实现97%以上的非负面清单数据“零审批”快速共享,平均审批时长小于1小时。畅通数据对外开放机制,按照“一类一策”原则,区分需求对象和用途,制定差异化的开放策略和流程。四是打造数据“新场景”,推进
38、数据应用赋能,积极响应国家科学治理和绿色低碳发展需求,与相关部门合作打造“生态环境+电力大数据”等创新应用。常态服务95%以上基层供电所和班组用数据说话、用数据管理、用数据决策、用数据创新。电力数据资源管理与应用赋能单位名称:国家电网有限公司典型做法19 四、发展趋势全国数据资源调查工作验证了我国发展数字经济具备超大规模市场、海量数据资源和丰富应用场景潜在优势。未来,随着数据技术不断进步,基础制度持续完善,数据生产规模将保持高速增长,存储计算将向按需调度发展,数据流通将向规范有序、多元协同发展,数据开发利用将向需求牵引、智能驱动发展。20 全国数据资源调查报告(2023年)(一)数据生产向高增
39、速和高质量同步发展(二)数据存储计算向一体化按需供给发展在政策、技术和应用多重因素驱动下,我国数据规模将保持快速增长趋势,高质量数据资源将成为经济增长的重要源泉。一方面,数据规模优势将进一步扩大。数据生产能力将随着卫星通信、自动驾驶、生成式AI等新技术的规模化应用而持续提升,预计2024年数据生产量增长将超25%,同时,数据存储能力也将随硬件技术的升级迭代和成本降低提升。另一方面,数字化转型将促进各行业高质量数据形成,数据从设备、系统的分散状态释放、汇聚和应用。同时,AI大模型的迅猛发展对大规模、高质量、多样性数据集提出更高要求,有助于数据质量进一步提升。随着人工智能训练需求的高涨,算力在短期
40、内仍会出现难以满足需求的情况,但会随应用需求加速调整布局,提高算力利用率。一方面,数据存储结构将按需调整,边缘智能计算将有所提高,把有价值的数据释放出来;协同交互需求推动部分数据向云端迁移,实现在线调度和应用。另一方面,随着数据高效计算、实时读取需求不断增长,未来全国一体化算力体系将向算力能力发布、算力调度、安全服务等多元功能扩展,缓解东部实时算力压力的同时,释放西部算力优势。(三)数据流通向规范有序、多元协同发展随着国家层面的数据交易规范进一步完善。一方面,随着数据流通基础规则不断完善,数据交易场所、数据服务商等流通载体将逐步走向规范有序发展。另一方面,场内场外流通交易模式更加多元化,各类细
41、分领域交易机构向专业化发展。平台企业和中央企业将持续发挥行业数据枢纽作用,带动行业领域的数据汇聚、流通和应用。21 全国数据资源调查报告(2023年)(四)数据应用向需求牵引、智能驱动发展应用场景牵引的数据开发利用将成为主要趋势,AI技术成为数据开发利用的重要推动力。一方面,应用需求涌现,场景逐渐丰富化。大模型对海量高质量数据提出了迫切需求,垂直领域的数据应用需求将持续保持快速增长,并逐步从业务降本提效转向协同创新、市场拓展,数据驱动业务发展将成为主要应用诉求。另一方面,自然语言处理、语音识别等技术进步降低开发门槛,围绕数据增值的产品服务将逐渐成为数据供给的主要方式。22 全国数据资源调查报告
42、(2023年)全国数据资源调查样本情况一、调查对象报告面向14类调查对象开展数据资源调查工作,有效样本情况如表1所示。附录表1 有效样本情况表序号调查对象调查主体数量(个)1政府部门国家行业主管部门292省/自治区/直辖市数据管理机构313计划单列市数据管理机构54科研机构重点高校335国家科学数据中心146国家实验室107算力中心算力中心22008电信运营商电信运营商49行业协会行业协会2210数据交易机构数据交易机构2711企业中央企业9412数据服务商平台企业35413非平台企业41414行业重点企业120223 全国数据资源调查报告(2023年)二、样本区域分布报告有效样本覆盖全国31
43、个省/自治区/直辖市的2064家企业,各地区企业分布情况如图1所示,其中山东、江苏、北京、湖北、浙江等省份样本企业较多。图1 企业区域分布图样本企业数量数据服务商数量行业重点企业数量平台企业数量非平台企业数量北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏西藏指标地区24 全国数据资源调查报告(2023年)16 农业包含农林牧渔业。工业包含采矿业、制造业、电力热力燃气及水生产和供应业、建筑业。交通物流包含交通运输仓储和邮政业。消费民生包含批发和零售业、住宿和餐饮业、房地产业、租赁和商务服务业、居民服务修理和其他服务业。科教文卫包含科学研究和技术服务业、教育、文化体育和娱乐业、卫生和社会工作。公共服务包含水利环境和公共设施管理业、公共管理社会保障和社会组织、国际组织。注:以上行业按照国民经济行业分类进行统计汇总。三、样本行业分布2064家有效样本企业在各行业16的分布情况如图2所示。其中,工业样本企业最多,农业、公共服务业的样本企业相对较少;数据服务商中为工业、消费民生领域提供服务的企业数量较多。图2 企业行业分布图行业类别服务该行业的数据服务商数量行业重点企业数量总量平台企业数量总量大企业数量中小企业数量农业工业交通物流金融业消费民生科教文卫公共服务地区