收藏 分销(赏)

详解6G系统数据治理方案的设计要点和原则.docx

上传人:二*** 文档编号:4714213 上传时间:2024-10-10 格式:DOCX 页数:9 大小:147.16KB 下载积分:5 金币
下载 相关 举报
详解6G系统数据治理方案的设计要点和原则.docx_第1页
第1页 / 共9页
本文档共9页,全文阅读请下载到手机保存,查看更方便
资源描述
详解6G系统数据治理方案的设计要点和 原那么数据的使用范围不同,数据治理本身不管是经济内涵还是技术内 涵也不同。数据治理是指通过相关流程和技术,对数据进行管理、 维护和深度开发,获得可以作为组织关键资产的高质量数据。 每个移动网络运营商(Mobile Network Operator, MN0)将移动 通信系统中产生的数据按技术域隔离并单独存储,这些技术域包 括无线接入网(Radio Access Network, RAN)、核心网(Core Network, CN)、传输网(Transport Network, TN)以及运行、 管理和维护(Operation, Administration, and Maintenance, OA&M)等。不同网元、不同参与者拥有的数据不够公开透明,由 此带来的数据孤岛是数据采集和共享中的主要瓶颈。 另一方面,大型OTT (Over-The-Top)业务公司在数据治理和变 现策略方面(如数据存储、分析服务、API接口)积累的专业知 识远远领先于电信领域公司。 6G系统的数据治理方案将为AI和感知业务提供有力支持,将催 生新的业务方式和系统特性。 01设计要点和原那么数据治理的范围远不止是传统的数据采集与存储。总体上,系统 设计需要考虑四个方面,如图1所示。 诊断性分析可以实现网络故障和业务损伤自主检测,识别 网络异常根因,从而提升网络可靠性和平安性。 预测性分析利用数据来预测未来事件,如流量模式、用户 位置、用户行为和偏好、资源可用性,甚至是故障。 建议性分析基于预测性分析为资源分配、内容展示等提供 建议。 数据面提供的知识来自数据分析服务,提供的知识包括主动知识 (如行动建议)和被动知识(如信息共享和客户的行动决定)。 数据分析服务可以基于客户需要,并根据客户需求定制。数据面 应按需多维度开放服务和数据,表1列举了可向客户提供的服务 类型的例如。可以预见的是,实际的客户类型比表格中所列举的 更丰富,客户对数据分析的需求和使用场景也各不相同。 ▼表1数据面提供的多维数据服务例如6.数据脱敏 客户 服务例如 基础设施网络管理员 基础设施网络性能监控、分析、预测、保障 基础设施网络资源利用监测与优化 基础设施网络配置、监测和优化 通信业务管理员 业务性能 州QoS)监测、分析、预测、保障 业务计费优化 业务平安监测、分析、预测、保障 设备连接管理员 设备位置跟踪和解析 设备活动状态配置与跟踪 设备移动方式监测、分析、预测 内容转发管理员 数据缓存和下发方案优化 第三方客户 用户行为分析例]对特定业务的兴趣度)、用户位置和分布等 社交环境分析向用户社交关系、情感、周边地点、位置移动) 收集和储存敏感数据,就涉及了隐私风险,需要承当隐私保护责 任。数据脱敏是回应隐私关切、实现法律遵从的重要动作,对于 在6G设计中支持AI和感知业务也尤为重要。 特别是对于AI任务,需要考虑跨领域的设计。近来有大量关于 AI领域中差分隐私(differential privacy)的研究,探讨如 何将单个设备的训练数据匿名化。 模型训练和AI推理过程中的数据脱敏在6G设计中必不可少。实 现差分隐私的方法包括:在不影响数据统计属性的前提下为训练 数据加入噪声,训练模型仍然可以捕捉到原始数据集的特征;使 用加密技术,使机器学习基于加密的(而非解密的)数据进行。 还有一种方法是,让设备发送模型参数,而不是训练数据,比方 说联邦学习和拆分学习。 在这一过程中存在一个风险,如果有完全掌握学习方法的内部人 员心怀不轨,那么他可以利用模型逐渐收敛的过程构造与训练数 据类似的信息。例如在联邦学习中,信息可能因此被泄露给恶意 设备。 不管何种学习方法,数据脱敏都是需要考虑的问题。因此,我们 需要在这个前提下,思考如何处理不同学习方法之间的差异和学 习方法自身的局限性。 ▲图1数据治理的设计要点 1 .数据可获得性和质量数据可获得性和质量是AI能否在各行业中得到应用的最大挑战 之一。提高数据的可获得性,意味着数据不能仅仅来自单个系统、 单个领域,而需要同时来自多个系统的不同领域。这就提出了一 个根本问题:如何打破(多厂商、多运营商、多行业之间的)物 理边界,让数据进入异构数据海洋? 一旦收集并利用了原本分散且相互隔离的数据,另一个问题随之 而来:如何提高数据的质量?海量数据的获取,并不意味着获取 的数据是可用的、高质量的。同时,在考虑降低数据处理计算复 杂度和能耗的同时,还需要提高数据处理效率。 2 .数据主权随着社会的全数字化转型,数据主权、数据平安和隐私的重要性 空前突出,很多国家都制定了隐私保护的法律法规。服务提供商 也在不断更新它们的隐私保护方案,主要国家政府也正在制定或 已发布了数据管理相关的规定。 例如,欧盟2018年公布的《通用数据保护条例》(General Data Protection Regulation, GDPR)就从欧盟层面上规范了数据的 使用。2019年,中国公布了《数据平安管理方法》,与2016年 公布的《网络平安法》一起构成了中国版的GDPR。美国也正在 实施隐私相关的法律,例如加州的《消费者隐私保护法》 (Consumer Privacy Act)已于 2020 年 1 月正式生效。 如何充分挖掘数据的内在价值,为各种业务提供精确支撑的同时 兼顾隐私保护,尊重数据主权,已成为近年来的热门话题。6G 系统设计应当考虑到监管的不确定性,尤其是存在于不同地区之 间的监管差异带来的不确定性。 3 .知识管理一般来说,知识可以看作是经过处理后的具有特定用途或价值的 数据,可以被不同技术和业务领域的物理实体或虚拟实体直接使 用。 知识管理包括知识的生成、更新和开放。就知识的生成和更新来 说,我们需要仔细把关数据的来源和质量,采取措施拦截不可靠 甚至是恶意的数据源产生的低质量和有害数据。而将知识作为一 种能力对外开放,那么需要适合的平台和接口设计。 4 .法律问题各种各样的传感器和其他技术可以实时产生数据,这让数据收集 和使用越来越复杂和敏感。数据生成能力的提升不仅提供了新的 数据流和内容类型,同时也引发了政策和法律对数据滥用的关 注:别有用心的机构或政府可能利用这些能力到达社会控制的目 的。 同时,新技术能力也让普通人难以分辨技术内容的真假。比方, 普通人就很难区分一段真实视频和一段“深度伪造” (deep fake)的视频。维护技术的社会利益和防止技术能力被用于实施社会控制、剥夺自 由之间存在一种脆弱的平衡,如何保护这一平衡,变得愈发重要。 为了识别欺诈行为、防止先进技术被滥用,需要更严格的法律和 政策手段。 02架构特点独立的数据面是数据治理系统设计中的关键特性(如图2所示), 它将为6G系统提供数据相关的通用能力,从而为6G系统内部和 外部功能提供透明、高效、内生平安和隐私保护。下文将介绍基 本概念和相关网络功能和业务。 数据面 多维数据业务 数据采集 数据源 基础设施与OA&M / ▲图2独立的数据面实现完整的数据治理.独立数据面 独立数据面旨在实现6G系统的数据治理方案,它处理的数据来 自不同业务实体。不管数据来自哪里,数据的整个生命周期都在 这一平面完成处理,包括数据生成与收集、数据处理与分析、数 据业务发放。 因此,独立的数据面可以为外部商业实体(如汽车、制造和医疗 等垂直行业)提供数据服务,也可以为6G系统本身(如控制面、 用户面和管理面)提供网络自动化和优化服务。网络运行相关的 配置、状态、日志,以及用户个人数据、传感器数据、其他各方 提供的数据都是提供的对象。 收集到的数据会形成丰富的数据资源,这些数据资源可以以分布式的形式被组织起来。为了防止直接将原始数据用于AI和感知 等应用而导致的问题,原始数据在被使用之前通常需要预处理 (如匿名化、数据格式再塑、去噪、转换、特征提取等)。 为确保数据完整、过程合规,数据处理过程中所涉及的政策(如 地理限制、国家或地区隐私法规等规定),不管是否来自监管层 面,都默认需要遵守。将数据传递至数据面时,还需要遵守数据 合同中约定的数据使用权利和义务。数据脱敏是保护隐私的关 键,数据面需要提供这一服务。 上述由数据面提供的所有服务,都由自包含的OA&M系统来运营 管理。 数据面的另一重要功能是基于数据收集、处理和编排生成知识。 为了协调来自不同数据源的数据的处理和传输,知识的生产也需 要按照合同要求进行。 随着新的数据源、数据模型、数据主题被数据客户关注和使用, 数据治理框架可以不断演进、不断充实。因此,数据治理框架的 运营管理和框架的实时开展是可以并行的。 由于数据面是一个逻辑概念,所以可以通过集中式分层架构实 现,也可以作为一种分布在边缘或深度边缘节点上的逻辑功能实 现。接下来我们将探讨数据面的一些关键要素。 1 .数据治理的多方角色数据治理生态系统包括两个维度的角色:从数据客户到数据提供 者、从数据所有者到数据管理者。不同的角色可以由不同的业务 实体担任。因此,6G中的数据治理是典型的多方参与场景,使 用6G系统提供的数据或知识的数据客户、6G系统的数据提供者 都可能参与其中06G可以有自己的数据治理框架,也可以在自身领域知识的基础 上,与其他行业参与者一起构建数据治理框架。也就是说,数据 治理框架可能存在不同的演进或开展路线。因此,不同业务实体 之间在运营阶段如何确定数据权利非常重要,可以借助区块链等 去中心化技术解决这一问题。 2 .数据资源数据资源的内容非常丰富,包括结构化数据、非结构化数据、预 处理数据、后处理数据、原始数据。从无线环境中高效收集数据 (如移动性等用户行为数据和网络状态数据)是数据治理的前 提。然后可以使用智能方法分析数据、将数据衍生的知识传输给 内外部客户。因而有必要了解数据的来源。 客户相关 2 OSS 行业通信系统 传输网行业OA&M相关 计算资源(深度边缘、边缘、云) 1基础设施客户相关 图3主要数据源类别图3展示了 6G系统中一些主要的数据源类别。 基础设施:基础设施即通信系统,包括RAN、TN和CN等 各类物理和虚拟资源,以及云、边缘和深度边缘等计算资源。基 础设施内部产生的数据包括计算资源信息、通信资源信息(如某 一网络功能的状态)、感知信息(如来自RAN的感知信息), 以及某些用户信息(如移动性信息、位置和相关上下文)。 运营支撑系统(Operation Support System, OSS):这一层 的数据包括所有OA&M相关的数据,如物理设备状态、系统运 行信息、业务发放信息。 业务支撑系统(Business Support System, BSS):这一层的数据包括所有与业务逻辑相关的数据,如客户信息、、伙伴关系管 理信息。更重要的还有消费者和企业客户的订阅数据,对于这些 数据,他们应拥有完全所有权和控制权。 行业通信系统:6G行业应用场景中,提供的数据可能还包 括行业相关OA&M数据信息、行业用户信息(如流量规律和移 动性数据)以及存储在云端的业务/服务数据。此类数据的所有 权应完全属于行业客户。 终端:来自终端侧的数据包括计算和通信资源、业务使用 概况、感知知识等。此类数据的所有权应完全属于终端用户。 3 .数据6G中,数据治理的一个主要作用就是提供合适的方法构建数据 资源,这需要合适的架构和网络功能的支持,构建数据资源的第 一步是收集数据,这一步有如下几个关键动作: 与数据源建立协议(如数据授权)和平安连接。 接收数据收集需求,确定收集范围,根据需求确定提供的 地点、时间和方式。 将数据属性告知数据源。 从数据源收集数据并入库。 对数据库中的数据进行操作和维护。 4 .数据分析在管理数据资源的基础上,为不同类型客户提供数据分析服务便 成为可能。有如下四种数据分析服务可以提供: 描述性分析挖掘历史数据的统计信息,提供网络洞察信息, 如网络性能、流量模型、信道状况、用户等方面。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服