收藏 分销(赏)

2022年大数据白皮书.pdf

上传人:Stan****Shan 文档编号:1300004 上传时间:2024-04-22 格式:PDF 页数:54 大小:1.56MB
下载 相关 举报
2022年大数据白皮书.pdf_第1页
第1页 / 共54页
2022年大数据白皮书.pdf_第2页
第2页 / 共54页
2022年大数据白皮书.pdf_第3页
第3页 / 共54页
2022年大数据白皮书.pdf_第4页
第4页 / 共54页
2022年大数据白皮书.pdf_第5页
第5页 / 共54页
点击查看更多>>
资源描述

1、No.202225 中国信息通信研究院 2023年1月 大数据大数据白皮书白皮书 (20222022 年年)前前 言言 中央全面深化改革委员会第二十六次会议指出,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。大数据是数据的集合,是围绕数据形成的一套技术体系,并衍生出了丰富的产业生态,成为释放数据价值的重要引擎。近一年来,从宏观看,各国通过政策、法案、设立机构等方式,持续推进自身大数据战略,我国党中央、国务院围绕数据要素市场建设、数据要素价值释放密集提出一系列重要论断、作出一系列战略部署

2、,进一步增强了我国大数据发展动能。从微观看,数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域均伴随相关政策、技术、产业、应用的不断演进,发展目标进一步明确和丰富,发展成效不断显现。本白皮书是中国信通院自 2014 年以来第七次发布的大数据白皮书。本白皮书聚焦过去一年来大数据领域不断涌现的新技术、新模式、新业态,分析总结全球和我国大数据发展的总体态势,并重点针对数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域,逐一分析、探讨其发展现状、特征、问题和趋势,最后对我国大数据未来发展进行展望与研判。希望本白皮书为社会各界深入了解大数据领域提供有价值的参考。目目 录录

3、 一、大数据发展总体态势.1(一)各国深化推进自身大数据战略.1(二)我国大数据发展态势好动力足.2(三)五大核心领域发展方向进一步明确.5 二、数据存储与计算:通过深度优化实现提质增效.7(一)数据存储与计算发展历久弥新.8(二)当前数据存储与计算发展呈现三大特点.10(三)数据存储与计算面临的主要挑战与发展趋势.13 三、数据管理:在政策引领下规模化落地.15(一)政策驱动行业实践日益成熟.16(二)当前数据管理发展呈现四大特点.18(三)数据管理面临的主要挑战与发展趋势.21 四、数据流通:流通规范体系加速构建.23(一)数据流通发展重心向“规范化”转移.23(二)当前数据流通发展呈现四

4、大特点.24(三)数据流通面临的主要挑战与发展趋势.28 五、数据应用:积极探索数据深层价值的释放路径.30(一)数据应用开始探索第三阶段实践路径.31(二)当前数据应用发展呈现三大特点.33(三)数据应用面临的主要挑战与发展趋势.36 六、数据安全:强需求牵引产业生态飞速发展.38(一)数据安全发展基础不断夯实.38(二)当前数据安全发展呈现三大特点.40(三)数据安全面临的主要挑战与发展趋势.44 七、总结与展望.46 参考文献.48 图图 目目 录录 图 1 大数据产业五大核心领域.6 图 2 数据存储与计算领域技术发展历程.9 图 3 2020-2022 年 DCMM 参评企业数量增速

5、.17 图 4 数据管理组织架构示意图.19 图 5 数据应用向基层渗透.35 图 6 数据分类分级“七步走”方法论图示.43 表表 目目 录录 表 1 近一年内国家层面推动大数据产业的代表性政策.4 表 2 五大核心领域发展现状和新形势下的发展方向.7 表 3 2022 年数据流通规则建设相关政策清单.25 表 4 数据应用三个阶段.31 表 5 典型数据应用方法论汇总.32 表 6 多个行业的企业数字化运营成熟度情况.34 表 7 近几年数据分类分级相关规范.43 大数据白皮书(2022 年)1 一、大数据发展总体态势 2022 年,全球大数据技术产业与应用创新不断迈向新高度。宏观看,国际

6、方面,美欧、韩日、澳洲通过政策、法案、设立机构等形式,持续深化实施自身大数据战略。国内方面,党中央、国务院再次做出一系列重要部署,我国大数据领域良好的发展态势进一步巩固。微观看,数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域发展成效不断显现。本章将对国内外大数据领域的最新进展进行总体叙述。(一)各国深化推进自身大数据战略(一)各国深化推进自身大数据战略 近一年来,美欧、韩日、澳洲通过政策、法案、设立机构等形式,持续深化推进自身大数据战略。美欧发布法案,确保数据价值在隐私保护的前提下释放。美国众议院和参议院于2022年6月发布了美国数据隐私和保护法案讨论稿,该法案在制度设计上

7、既考虑了增强个人数据权利的国际趋势,又包含数据价值释放的内容。法案并未禁止一般个人数据处理活动,而是为个人提供了“选择退出”方式,以促进对个人数据的合理利用。欧洲议会于2022年4月就欧盟数据治理法案进行最终投票表决,并获得议会批准。该法案是落实欧洲数据战略的重要举措,构建了三个适用于各个行业的数据共享机制,确保在符合欧洲公共利益和数据提供者合法权益的条件下,实现数据更广泛的国际共享。法案构建了适用于所有部门的数据使用权基本规则,将促进个人和企业自愿大数据白皮书(2022 年)2 共享数据,并统一某些公共部门数据的使用条件。韩日设置专门机构,推进各行业数字化转型。韩国在2022年4月成立了以国

8、务总理作为委员长的“国家数据政策委员会”,作为国家数据和新产业政策的管理机构,并于9月召开了韩国国家数据政策委员会的第一次会议,发表了对8个数据领域、5个新产业领域、共计13个领域的改善计划,目标是在韩国打造全球顶级水平的数字力量。2021年9月,日本政府成立数字厅,成为负责日本行政数字化的最高部门,旨在构建更完善的数字政府,推动数字化转型,目标为“用智能手机在60秒内完成所有行政程序”,最大程度利用数字技术优势,将数字科技作为全新要素融入传统社会,促进经济社会形态积极转型。澳洲发布国家数据安全战略,开始构建国家数据安全框架。2022年4月,澳大利亚内政部颁布国家数据安全行动计划,其为澳大利亚

9、首个国家数据安全行动计划,意味着澳大利亚的国家数据安全框架正式开始构建。行动计划致力于建立一个全国性的方法来保护公民数据,保护公民的数据(收集、处理和存储在数字系统和网络上的信息)免受侵害,同时为政府、企业和个人构建数据安全要求。(二)我国大数据发展态势好动力足(二)我国大数据发展态势好动力足 我国大数据经过多年高速发展,不断取得重要突破,呈现良好发展态势。一是产业规模高速增长,2021 年,我国大数据产业规模增加到 1.3 万亿元,复合增长率超过 30%1;二是创新能力不断增强,2021 1 国家互联网信息办公室数字中国发展报告(2021 年),2022 年 7 月 大数据白皮书(2022

10、年)3 年我国发表大数据领域论文量占全球 31%2,大数据相关专利受理总数占全球超 50%,均位居第一3;三是生态体系持续优化,2021 年我国大数据市场主体总量超 18 万家4,一批大数据龙头企业快速崛起,初步形成了大企业引领、中小企业协同、创新企业不断涌现的发展格局;四是市场前景广受认可,我国大数据领域投融资金额多年来总体呈现上升趋势,2021 年大数据相关企业获投总金额超过 800 亿元5,再创历史新高。近一年,我国在政策、人才、资金等方面持续加码,为大数据后续发展注入强劲动力。政策方面,中央、地方发布一系列支持文件,对大数据产业、数字技术、数据要素市场、数据安全等方面进行了重点部署。中

11、央层面,2021 年底,“十四五”大数据产业发展规划的出台明确了未来五年大数据产业发展工作的行动纲领。2022 年,党中央、国务院先后通过要素市场化配置综合改革试点总体方案、关于加快建设全国统一大市场的意见、关于构建数据基础制度更好发挥数据要素作用的意见等文件,多次强调了释放数据要素价值对于我国发展的必要性、紧迫性,为我国大数据发展提供了良好的政策环境和明确的发展目标。地方层面,31 个省(区、市)均通过发布大数据专题规划、数字经济总体规划等形式,明确了各地大数据技术、产业、应用的发展路线图、时间表,凸显出各地在大数据布局方面的积极性。2 中国信通院根据 Web of Science 数据库收

12、录的 SCI 论文数据统计得到。3 中国信通院根据 Inspiro 知识产权数据库的数据统计得到。4 中国信通院根据企查查相关数据统计得到。5 中国信通院根据公开监测、获取到的企业信息,结合企业介绍、主营业务及服务介绍及相关其他信息,进行筛选和分类得到。大数据白皮书(2022 年)4 表 1 近一年内国家层面推动大数据产业的代表性政策 时间时间 文件文件 内容内容 2021.11 工信部“十四五”大数据产业发展规划 提出“到 2025 年底,大数据产业测算规模突破 3 万亿元”的增长目标,以及数据要素价值体系、现代化大数据产业体系建设等新目标 2022.1 国务院 要素市场化配置综合改革试点总

13、体方案 提出拓展规范化数据开发利用场景,发挥领军企业和行业组织作用,推动人工智能、区块链、车联网、物联网等领域数据采集标准化。加强数据安全保护,强化网络安全等级保护要求,推动完善数据分级分类安全保护制度,运用技术手段构建数据安全风险防控体系。2022.4 中共中央 国务院 关于加快建设全国统一大市场的意见 提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。2022.12 中央全面深化改革委员会第二十六次会议,审议通过关于构建数据基础制度更好发挥数据要素作用的意见 习近平总书记强调“数

14、据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系”来源:中国信息通信研究院 人才方面,过半“双一流”高校设立大数据相关专业,多省份积极开展人才培育专项行动,人才供给能力显著增强。高校教育方面,147所“双一流”高校中有87所已开设了大数据专业,占比达到59%6,根据上海软科统计,大数据专业热度已经超过软件工程等传统热门专业。各省积极开展大数据人才培育专项行动,例如广东实施“十万”产业数字化符合性人才培训行动,上海要求各级党校(行政学院)要增加大数据与城市

15、数字化转型的培训内容,浙江围绕数字人才制定“高精尖缺”人才目录,江苏搭建“智改数转”人才智库平台,福建明确要求县级以上地方人民政府制订大数据人才发展计划。6 中国信通院根据教育部普通高等学校本科专业备案和审批结果进行统计获得 大数据白皮书(2022 年)5 资金方面,多省份通过设立专项资金或采取税收优惠政策等方式,对大数据企业、应用进行定向扶持和培育。例如,宁夏对于区内符合标准的优质大数据企业给予最高 300 万的资金支持,山东、黑龙江等省份要求省内县级以上人民政府每年需统筹安排资金专项扶持大数据相关企业,浙江、广东、重庆等推出一系列围绕大数据企业的税收减免政策,江苏省每年在省级财政安排 12

16、 亿元专项资金支持工业企业“智改数转”,贵州、辽宁、河北、云南等省份对建设成果显著的大数据应用项目补贴 1000-3000 万。(三)五大核心领域发展方向进一步明确(三)五大核心领域发展方向进一步明确 经过多年技术和产业的发展,大数据领域内部逐渐细化,形成数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域。如图 1 所示,数据源通过数据存储与计算实现压缩存储和初步加工,通过数据管理提升质量,通过数据流通配置给其它相关主体,通过数据应用直接释放价值,并由数据安全技术进行全过程的安全保障。这五大核心领域由于发展起步时间不同、应用需求紧迫程度不同等原因,发展模式存在差异。在当前数据成

17、为生产要素并快速融入生产、分配、流通、消费等各环节的新形势下,大数据五大核心领域的发展方向均进一步明确。大数据白皮书(2022 年)6 来源:中国信息通信研究院 图 1 大数据产业五大核心领域 数据存储与计算领域:实现海量数据的高效存储与计算。本领域发展时间长,在数据规模增长、形态变化等新需求持续推动下,逐步演化出数据库、大数据平台、实时计算等成熟技术框架。当前,数据存储与计算领域已经能够支撑 PB 级海量数据的高效存储和准实时计算,发展方向聚焦为在持续提升能力基础上,通过精细化运营和技术升级实现“降本提质”。数据管理领域:实现数据质量提升、管理高效。本领域属于投入周期长、见效慢的“下水道”型

18、工作。当前,部分企业数据管理需求强、资源足,已将数据管理的技术和规则率先落地,但大部分企业数据管理仍处于起步阶段。数据管理的发展方向聚焦为尽快借助政策红利和智能技术带来的改变,促进各行业大规模实现全域数据管理。数据流通领域:实现数据在不同主体间合理配置,使局部数据互大数据白皮书(2022 年)7 相弥合,实现数据价值倍增。本领域需求旺盛、发展时间短,当前已初步探索出机构与机构间点对点的流通路径,但数据权属、定价、市场规则等关键性问题仍有待破解。为助力数据要素高效配置,数据流通的发展方向聚焦为通过建设基础制度、创新流通技术,实现数据流通过程中安全与效率的平衡,从而构建全社会范围数据规范化流通。数

19、据应用领域:实现数据为企业业务经营过程赋能。本领域虽然发展时间长,但受限于数据管理等前序工作成熟度不够,目前仅部分核心业务被数据浅度赋能。为释放数据要素深度价值,数据应用的发展方向聚焦为通过变革业务模式、优化相关技术,使数据应用与全域业务深度融合。数据安全领域:确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。特别是近两年数据安全一些法律法规发布后,本领域得到快速发展,各行业在数据外规内化、风险治理等方面推进步伐明显加快。当前,数据安全的发展方向进一步聚焦为兼顾安全与效率,从而实现安全左移的自动化与风险治理的智能化。表 2 五大核心领域发展现状和新形势下的发展方向 发展现状

20、发展现状 新形式下的发展新形式下的发展方向方向 数据数据存储与计算存储与计算 实现了海量数据的高效存储、计算 降低运维成本,提升处理效率 数据管理数据管理 头部行业实现关键数据的管理 各行业均实现全域数据管理 数据流通数据流通 点对点间流通路径完成初步探索 全社会范围规范化流通 数据应用数据应用 支撑核心业务分析和顶层决策 以无感形式嵌入全域业务 数据安全数据安全 推进外规内化与风险治理 安全左移的智能化治理 来源:中国信息通信研究院 二、数据存储与计算:通过深度优化实现提质增效 数据存储与计算提供海量数据的高压缩比存储和高效计算等基大数据白皮书(2022 年)8 础能力,以数据库、数据仓库、

21、数据湖等为其技术表现形态。其发展历程长、产业成熟度相对较高,目前在数据要素等新需求牵引下,正呈现出稳中有进的发展态势。本章将介绍数据存储与计算领域的发展历程、当前现状、主要特征和趋势展望。(一)数据存储与计算发展历久弥新(一)数据存储与计算发展历久弥新 1960 年信息时代开启后,用于存储、计算少量结构化数据的关系型数据库、数据仓库诞生,Oracle、DB2、Teradata 等商业化产品逐渐成熟。2000 年互联网兴起后,结构化数据的规模迅速膨胀、非结构化数据开始涌现,传统关系型数据库、数据仓库能力出现瓶颈,以Apache Hadoop 为代表的分布式存储计算框架成为新的技术潮流,Cloud

22、era、Hontonworks 等数家商业化公司纷纷成立,大数据时代正式来临。2010 年移动互联网逐渐普及后,实时推荐、即时决策需求对海量数据处理的实时性提出更高要求,同时视频、音频、图片等非结构化数据占比大幅提升,Storm、Flink 等流处理框架受到关注,数据湖技术也开始迅速产品化。图 2 对数据存储与计算领域的技术发展历程进行了简要总结。大数据白皮书(2022 年)9 来源:中国信息通信研究院 图 2 数据存储与计算领域技术发展历程 技术方面,经过 60 余年发展,数据存储与计算领域总体技术框架趋于成熟,进入深度优化阶段。数据存储与计算领域已经形成了以分布式数据库、数据仓库、批处理平

23、台、流处理平台为代表的总体技术框架,并广泛应用,已能够支撑具有高并发、低延迟数据处理分析需求的极端场景。例如在“双十一”场景中,大量营销、交易风控等自动决策被嵌入业务流程,形成了复杂的数据处理分析链路。在技术能力已相对成熟的基础上,以云化、湖仓一体为代表的深度优化理念不断涌现,并逐步应用,为数据存储与计算领域进一步降本提质提供了新范式。产业方面,全球疫情加速了数字化转型进程,数据存储与计算领域的产业发展前景持续向好。国际方面,国际云数据仓库巨头Snowflake 2022 年第三季度营收与去年同期相比上涨 67%,达到 5.5亿美元;国内方面,2021 上半年我国大数据平台市场规模达 54.2

24、 亿大数据白皮书(2022 年)10 元,同比增长 43.5%7;2021 年我国数据库市场规模预计达 305.78 亿元,同比增长 26.93%8。同时我国大数据基础软件第一股星环科技于2022 年 10 月成功上市科创板。数据存储与计算领域市场增长趋势和行业预期持续向好。建设运维方面,数据存储与计算建设持续深入,安全稳定运行成为关注焦点。随着数字化转型的开启,工商银行、建设银行、农业银行等头部金融机构,电信、移动、联通等运营商,大型互联网公司以及诸多行业头部企业均在数年前完成数据存储与计算总体框架建设。近年来,随着数据规模增多、价值提升,数据存储与计算技术平台逐渐复杂,运维使用时的稳定性保

25、障和安全防护成为难题。2022 年,Google、Twitter 等公司的数据存储与计算技术平台均发生故障,同时,全球范围内也发生多起针对数据存储与计算技术平台的恶性攻击,相应安全事件带来的损失也不断增高。(二)当前数据存储与计算发展呈现三大特点(二)当前数据存储与计算发展呈现三大特点 1.云化改造全面加速 数据存储与计算技术持续与云融合,资源利用率进一步提升。随着云计算的发展,数据存储与计算技术逐渐从私有部署转化为云上部署,初期体现为部署模式的不同,但伴随着云原生理念的兴起,云原生数据存储与计算产品开始成为产业变革浪潮。利用云原生理念,数据存储与计算一方面实现存储、计算、调度、安全、分析等模

26、块的进 7 来源:IDC 咨询 8 来源:中国信息通信研究院数据库发展研究报告(2021 年),2021 年 7 月 大数据白皮书(2022 年)11 一步解耦,各模块与容器等底层资源单元相适配,实现弹性扩缩容,从而使得资源利用率提升 30%40%;另一方面实现应用接口函数化,即利用 Serverless 的理念,将更多如统计、机器学习、流程处理等能力封装成函数接口,实现更细粒度的按需使用和付费,在提升 23 倍发布效率的同时,有效降低成本。近年来,华为、腾讯云、阿里云、百度、星环等国内主流大数据企业均推出云原生数据湖、云原生数据平台等产品。2022 年阿里云首款 Serverless 数据库

27、产品 RDS MySQL Serverless 正式商业化,PingCAP 在 HTAP Summit 上宣布 TiDB Cloud Serverless Tier BETA 版正式发布。2.融合一体化持续加深 批流一体、湖仓一体、HTAP(Hybrid Transaction Analytical Processing,混合事务与分析处理)等融合架构不断降低运维成本。随着数字化转型的深入,企业通常会针对不同的业务场景、不同的数据模型搭建不同的平台系统,带来了数据冗余、数据一致性差、资源配置难、系统复杂等问题,极大增加了运维的压力与成本。为解决上述问题,数据存储与计算领域各技术产品转向融合架构

28、成为趋势,例如将批处理技术与流处理技术融合的批流一体技术框架、打通数据仓库和数据湖技术的湖仓一体技术框架以及同时具备在线事务处理及分析的混合事务分析处理技术。建立融合架构后,统一的接口层、计算层、存储层、资源调度层实现了对海量数据的统一管理和集群服务的统一运维,大幅降低了运维综合成本。国内外厂商纷纷提出自己的融合架构解决方案。例如,近年来海外厂商 Databricks 同戴尔推出 Data 大数据白皮书(2022 年)12 LakeHouse、亚马逊推出智能湖仓架构,2022 年国内厂商巨杉数据库推出 SequoiaDB、阿里云推出 MaxCompute 湖仓一体方案、星环科技推出星环湖仓一体

29、 V2.0 等。数据中间件技术为计算层与异构存储层搭建桥梁,提升整体运行效率,进一步加速数据平台融合一体化。在存算分离后,存储层为满足不同类型数据存储的需求,文件存储、对象存储、表存储等多种异构存储引擎同时存在。计算层和异构存储引擎之间的连通复杂度越来越高,数据中间件技术应运而生,其通过内置兼容接口和加速技术,助力计算层与异构存储层高速互联。例如开源的 Alluxio 向上对接Spark、Presto、Hive、TensorFlow 等计算应用,向下对接阿里云 OSS对象存储、AWS S3 存储、HDFS 等不同存储,可提升 I/O 效率 200%以上;ShardingSphere 将多类异构

30、数据库 MySQL、PostgreSQL、Oracle、SQL Server、openGauss 等包装为统一数据库访问接口,从而方便多种编程语言直接访问多类异构数据库。3.安全能力快速补强 数据存储与计算面临着新型安全挑战,内生安全正成为传统防护的重要补充。一是随着自身规模不断庞大,数据存储与计算技术平台的边界不断延伸,网络安全防护体系随之指数级膨胀,容易出现盲点、漏点;二是伴随数据开发利用的深化,数据存储与计算技术平台中的关键数据与其他系统将进行高频的互联互通,安全和效率难以均衡;三是数据存储与计算技术平台的技术组件 60%以上基于开源技术,容易遭遇“0day”攻击;四是数据存储与计算技术

31、平台中数据集中存储,大数据白皮书(2022 年)13 但操作人员类型多、数量多、变更多,操作频次高,存在数据泄露风险。2022 年 1 月,美国交通运输业商业信用报告机构 TransCredit 因配置错误致使数据库无密码保护,共计涉及 50 万人财务数据的 60 多万条信用记录泄露;2022 年 6 月,土耳其飞马航空公司因其 AWS 云存储桶未受保护,发生总计约 6.5TB 的数据泄露,其中包含敏感的飞行数据;2022 年 10 月,跨国集团汤森路透因配置错误导致存有 3TB敏感数据的 Elasticsearch 数据库发生泄漏。近年来频发的数据泄漏事件,使得全密态执行环境、敏感数据自动识

32、别、高效数据加解密、细粒度的权限控制、零信任等内生安全技术在数据存储与计算技术产品中的应用不断增加,与传统网络安全防护相辅相成。近一年,华为云、阿里云相继推出全密态数据库,星环科技 TDH、阿里云 Dataworks 纷纷加入敏感数据识别能力,亚马逊 RDS 增加内置防火墙。(三)数据存储与计算面临的主要挑战与发展趋势(三)数据存储与计算面临的主要挑战与发展趋势 经过半世纪的发展,数据存储与计算领域总体技术框架基本成熟,产业稳步发展,为上层各类数据应用诞生提供了坚实基础。但随着数字化转型从头部行业向传统行业延伸、数据的生产要素属性不断凸显,数据存储与计算领域也迎来新的挑战。一是数据存储与计算技

33、术平台建设运营成本仍需控制。数据存储与计算技术平台规模体量大、建设周期长、前期投入高,但投资回报率却相对较低。随着疫情以来经济大环境发生变化,企业需要更加理性、务实的开展数据存储与计算技术平台建设,从实际收益的角度进行评估论证和精细化运营,同时数据存储与计算技术也应从降低运维使用成本等方面优化提升。二是促大数据白皮书(2022 年)14 进数据要素市场化的数据存储与计算技术创新仍需加强。随着数据成为生产要素,数据的潜在价值愈发受到重视,但当前数据要素市场建设面临数据权属、定价、安全保护等难点问题,这其中的一些问题是否能通过数据存储与计算相关技术得到解决或加以规避,正在成为摆在数据存储与计算领域

34、发展过程中的关键命题。未来,数据存储与计算领域呈现以下三点趋势。一是技术和管理双管齐下,探索数据存储与计算技术平台精细化运营之路。据 Wikibon 研究,全球范围内企业数据存储与计算技术平台的平均投资回报率仅为 55%,46%的企业数据存储与计算技术平台未达到预期价值。投资回报率低成为制约数据存储与计算技术平台渗透率进一步提升的重要因素,产业正尝试从技术和管理两方面探索精细化运营之路。技术方面,核心计算、存储等模块尝试与 AI 结合,通过智能资源调度、智能数据分层存储等,实现精细化运营;管理方面,探索公司内部成本分摊方式,从而避免业务部门无成本观念式使用数据存储与计算技术平台,例如技术部门向

35、业务部门售卖资源模式、按业务部门使用量计费模式等。二是数据编织(Data Fabric)、全密态数据库等新理念新技术不断成熟,为数据的要素价值释放提供更强力的技术底座。数据要素市场形成涉及数据权属、定价、安全保护等一系列问题,传统数据存储与计算技术重点关注计算、存储效率,未解决数据要素市场面临的问题。随着数据规模和数据关系复杂度的增加、数据权属问题的复杂化,传统集中式数据管理模式无法满足需求,出现了 Data Fabric 这一概大数据白皮书(2022 年)15 念。Data Fabric 基于主动型元数据、增强数据目录、数据虚拟化等技术,形成了一套分布式、自动化、智能化的新型数据管理形式,当

36、前IBM 已经推出了相关解决方案。全密态数据库使数据在传输、计算以及存储的各个环节始终都处于密文状态,从而解决数据全生命周期的隐私保护问题,提供数据要素安全保护的能力,目前阿里云、华为均已推出相关产品。三是我国数据存储与计算领域技术和产品将逐步走向海外市场。我国数据存储与计算领域产业经过多年发展,在部分技术领域的供给能力已经达到国际一流水平。当前,以东南亚为代表的新兴数字经济市场规模正在快速增长,数据存储与计算技术平台的建设需求十分旺盛。根据谷歌、淡马锡和贝恩公司发布的2021 年东南亚数字经济调查报告 显示,东南亚数字经济产业将在五年内实现翻倍增长,在2026年达到 3600 亿美元。在这一

37、背景下,二十大报告中提出“发展数字贸易”,商务部、中央网信办、工信部联合印发数字经济对外投资合作工作指引,推动我国在数字经济领域逐渐形成对外开放新格局。当前,我国数据存储与计算领域的部分企业已开始走向海外市场,阿里巴巴、腾讯等企业已经开始借助自身全球云计算网络基础,PingCAP、OceanBase 等企业借助开源优势,助力其数据库、大数据产品突破日本、印尼等海外市场。三、数据管理:在政策引领下规模化落地 数据管理通过规范数据采集、加工、使用过程,在企业释放数据价值的过程中扮演了“承上启下”的关键角色,是企业丰富数据应用、大数据白皮书(2022 年)16 参与数据要素流通的前序基础。由于数据管

38、理属于投入多、见效较慢的基础性工作,前期仅资源充足的数字原生企业对于数据管理工作的推进速度较快。近年来,在政策支持下,各领域企业的数据管理意识和能力不断增强,越来越多的企业开始从顶层统筹规划数据管理工作,我国数据管理能力建设呈现大规模落地态势。本章将介绍数据管理领域的发展历程、当前现状、主要特征和趋势展望。(一)政策驱动行业实践日益成熟(一)政策驱动行业实践日益成熟 各领域政策为数据管理落地注入强劲动能。通信领域,工业和信息化部于 2021 年 11 月发布了 “十四五”信息通信行业发展规划,提出加强数据资源管理,探索建立数据应用处理、数据产品标准化、数据确权、数据定价、数据交易信任、数据开放

39、利用全流程的数据资源管理制度体系。制造业领域,工业和信息化部于 2021 年 11 月印发了“十四五”信息化和工业化深度融合发展规划,提出强化大数据在制造业各环节应用,制定制造业数字化转型行动计划,以制造业数字化转型为引领,培育专业化、场景化大数据解决方案。金融领域,央行于 2022 年 1 月发布了金融科技发展规划(2022-2025 年),要求全面加强数据能力建设。银保监会于同期发布了关于银行保险业数字化转型的指导意见,提出健全数据治理体系,增强数据管理能力,加强数据质量控制,提高数据应用能力。其他领域,交通运输部于 2021 年 10 月印发数字交通“十四五”发展规划,农业农村部于 20

40、22 年 8 月发布农业现代化示范区数字化建设指南,提出加大数据治理力度,完善数据质量管控,推动数字交通、数字乡村等大数据白皮书(2022 年)17 领域发展。行业、地方大力推动 DCMM 贯标评估,通过“以评促建”的方式提升数据管理能力。工业和信息化部信息技术发展司组织协调全国信息技术标准化技术委员会(TC28)于 2014 年开始了我国数据管理国家标准研制工作,于 2018 年发布了数据管理能力成熟度评估模型(Data management capability maturity assessment model,简称DCMM),从组织、制度、技术、人员等方面综合评价企业数据管理水平。DC

41、MM 评估自 2020 年启动,河北、天津、无锡等 20 余省市相继发布针对性支持政策,推动 DCMM 参评企业数量持续增长,截至目前已累计完成近千家企业的评估,参评企业分布于全国各地,企业类型覆盖软件和信息技术服务业、制造业、银行业、电力业、通信业等多个行业。2021 年参评企业增速为 88.7%,2022 年参评企业增速为 152.9%,两年获证企业数量平均增速达到了 120.8%。来源:中国信息通信研究院 图 3 2020-2022 年 DCMM 参评企业数量增速 头部企业数据管理工作已经进入深水期,但大部分企业仍处于数大数据白皮书(2022 年)18 据管理初期。中国电子信息行业联合会

42、 DCMM 评估统计结果显示,现阶段通信业、银行业、电力业数据管理能力相对领先,逐渐迈入深水区,以上 3 个行业 DCMM 评分普遍在 3 级以上,通信业 4 级占比超过了 60%,银行业 3 级占比接近 70%,电力业 3 级和 4 级累计占比达到 85%。软件和信息技术业、制造业数据管理能力相对薄弱,以上两个行业集中于 2 级和 3 级,同时 2 级比例远高于 3 级,其中软件和信息技术业的 2 级占比是 3 级 2 倍以上,累计占比达到 97%,制造业的 2 级占比接近 3 级的 5 倍,累计占比达到 98%。(二)当前数据管理发展呈现四大特点(二)当前数据管理发展呈现四大特点 头部企业

43、数据管理起步较早,数据管理能力相对成熟,管理方法和模式对于发展初期的企业具有良好的参考价值。宏观管理层面,成立了专门数据管理团队,发布独立数据战略规划,提升数据管理专业性;微观执行层面,强化数据供给能力,全面提高数据质量水平,依托统一数据管理平台,提高数据管理效率。1.通过成立专职团队增强数据管理执行效率 为推动数据管理有效开展,越来越多的企业成立统一数据管理归口部门,形成了决策、管理、执行的数据管理三层架构组织,并设置了专门的数据管理岗位,建立了数据部门、技术部门和业务部门协同机制。例如,中国移动成立 IT 管委会统筹数据管理制度、标准、流程,信息技术中心牵头全网各域数据治理和平台建设,并加

44、挂大数据中心负责大数据管理和运营,与各业务部门及省专单位数据“管、建、战”协同。中国联通在集团成立了数字化转型部门,统筹负责数据管大数据白皮书(2022 年)19 理工作,在网络域、管理域、客户域的业务部门、市场部、分子公司指定了数据管理对接人,由联通软研院承担数据管理技术平台开发和运维工作。工商银行在金融科技委员会下设数据治理委员会作为决策层,数据管理部/信息管理部作为管理层,大数据中心/软件开发中心提供技术支持,核心业务部门负责数据采集和数据应用,负责执行具体数据管理工作。来源:中国信息通信研究院 图 4 数据管理组织架构示意图 2.通过发布独立规划推动数据管理精准开展 在企业纷纷发布数字

45、化转型整体战略基础上,为精准提升数据管理工作的质量和效率,越来越多的企业发布了独立的数据管理战略规划,从而确立数据管理工作的中长期目标和管理活动优先级,明确需要的资源投入总量和资源分配机制,指导数据管理团队的工作有效执行。例如中国电信集团 2021 年发布了中国电信数据治理体系化推进工作指引,旨在结合“云改数转”数字化转型整体思路推动数据管理工作体系化开展,指导集团下各单位从数据模型管理、数据质量管理、数据安全管理、数据共享等方面推进数据治理工作高效开展。大数据白皮书(2022 年)20 3.通过开展专项行动进一步提升数据供给质量 良好的数据供给能力是数据分析挖掘的基础,在工业物联网、工业互联

46、网、边缘计算等技术快速发展的背景下,企业业务线上化加速、数据规模爆炸性增长,如何保障数据质量水平、增强数据可信可用成为了数据管理的关键一步。以南方电网为例,数据量从“十三五”初期的 220TB 提升至 2.4PB,数据采集范围拓展至竞争性业务、金融业务等板块,关键运行数据采集频率提升超过 60 倍。在数据源头快速变化的背景下,南方电网在常态化数据质量治理的基础上开展数据质量提升专项,短时间内、集中资源力量打通数据质量工作的难点、堵点,在主配网数据治理领域,形成配网数据问题识别规则 14 项,累计识别并整改 2100 余万条数据质量问题,全网各单位变电站轮廓坐标、杆塔坐标准确率达到 99%。4.

47、通过统一技术平台消除数据管理协同难点 早期,各企业针对数据管理中的各项工作,逐步建设了数据标准管理平台、数据质量管理平台、数据架构管理平台、元数据管理平台、主数据管理平台等单一功能型技术工具,这些技术工具通常独立存在,使得数据管理各项活动间衔接性较差,例如数据标准难以应用于数据模型、数据质量难以从源头把控等,导致管理资源的冗余和浪费。随着统一数据管理平台的成熟,其将各单一功能型技术工具进行集成,构建了数据管理工作的“一站式”技术平台,对于统筹数据管理工作、提高数据管理效率的作用日益突出。例如中国移动构建了元数据驱动的统一数据治理平台,全面拉通异构跨地域跨平台的元数据,统一支大数据白皮书(202

48、2 年)21 撑数据管理、开发、运营、运维人员的数据治理工作,实现数据一点可看、可控、可管。国网大数据中心基于统一数据管理技术平台,实现总部及 27 家省(市)公司 PB 级数据的统一管理,有效加快电网整体数字化转型升级。(三)数据管理面临的主要挑战与发展趋势(三)数据管理面临的主要挑战与发展趋势 目前企业在数据管理方面仍然面临三点挑战。一是数据的业务价值不显著,数据管理内驱动力不足。推动业务创新和发展是数据价值的最终目标,由于企业缺乏对数据产生业务价值进行度量的体系,导致企业决策层、管理层和业务部门难以对数据价值有效感知,进一步降低了企业持续开展数据管理的动力。二是数据、IT 和业务仍存在割

49、裂,组织架构亟需变革调整。尽管越来越多的企业成立专门的数据管理团队,但是尚未明确数据管理团队与 IT 团队、业务团队的协作机制,导致数据管理与企业信息化建设和业务发展脱节,阻碍了数据管理成果在企业系统和业务场景的落地。三是数据管理人才缺失,数据管理推进后劲不足。由于数据管理是一个新兴领域,有别于传统的数据库和计算机领域,需要的是具备管理能力、技术能力和业务能力的复合型人才,因此面临较大缺口。未来,数据管理领域呈现以下三点趋势。一是首席数据官(Chief Data Officer,CDO)制度将助力企业全面开展数据管理。CDO 是有效管理和运用企业数据资源、充分挖掘数据价值、驱动业务创新和转型变

50、革的企业负责人,负责为公司制定一个明确的数字化战略,确保相关举措都获得资源分配,并通过衡量数大数据白皮书(2022 年)22 字项目投资回报率的方式,提高客户参与度和忠诚度,推动企业形成数据管理良性闭环。事实上,在过去的几年里,国外已有包括通用电气、富国银行在内的众多企业设置了 CDO 岗位,全面推动企业数字化转型。国内广东省于 2022 年在政府工作报告重点任务分工方案明确提出,要“出台企业首席数据官建设指南”,鼓励具备条件的企业在决策层设立 CDO,按照“企业主导、政府推动、价值优先、多方协同”的建设原则组织实施。二是数据研发运营一体化(DataOps)将有效提升数据管理协同效率。随着数据

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服