收藏 分销(赏)

中国非结构化数据中台实践白皮.pdf

上传人:宇*** 文档编号:3146568 上传时间:2024-06-20 格式:PDF 页数:65 大小:7.15MB
下载 相关 举报
中国非结构化数据中台实践白皮.pdf_第1页
第1页 / 共65页
中国非结构化数据中台实践白皮.pdf_第2页
第2页 / 共65页
中国非结构化数据中台实践白皮.pdf_第3页
第3页 / 共65页
中国非结构化数据中台实践白皮.pdf_第4页
第4页 / 共65页
中国非结构化数据中台实践白皮.pdf_第5页
第5页 / 共65页
点击查看更多>>
资源描述

1、释放非结构化数据价值,助力数据驱动型组织 中国非结构化数据中台实践白皮书 V2July.2021数字化转型催生数据驱动型组织01目录非结构化数据中台助力数据驱动型组织02非结构化数据中台的应用场景03Content非结构化数据中台的建设指南04非结构化数据中台的未来趋势0501数字化转型催生数据驱动型组织中国非结构化数据中台实践白皮书V2数字化转型持续深入数字化转型催生数据驱动型组织数据中台是数据能力建设的核心支撑非结构化数据中台兴起全球经济下行,人口红利、城镇化红利、互联网红利逐渐消失,数字化转型是未来唯一的增长红利。当下,转型领军企业竞争壁垒已然显现,更多传统企业加速布局,数字原生企业快速

2、涌现,数字化转型持续深入。需求驱动数字化转型的核心是数据。数字化转型进程中,海量、多元化的数据积累,使得数据可赋能更多场景、行业。同时,云计算、大数据、人工智能、5G、物联网等技术的成熟,降低了数字化转型的门槛,使更多企业深入推进数字化转型成为可能。技术驱动数字化转型持续深入“十四五”规划对数字化战略进行重要部署,强调以数字化转型整体驱动生产方式、生活方式和治理方式变革。发展数字经济已上升到国家战略高度,数字化转型将步入深水区。政策驱动数字化转型需求技术政策数字化转型是指企业利用数字技术,通过商业模式、业务流程、组织架构等重塑,为客户创造新的价值。Page4Page5数字化转型催生数据驱动型组

3、织数字经济时代,催生以数据为代表的新型生产要素。以数据驱动业务,打造数据驱动型组织,已然成为企业数字化转型的主线。传统企业中,数据是副产物,业务人员基于行业经验和原有流程去做业务,数据主要是用于监测业务进展和洞察一些规律,由业务人员做最终决策。数据驱动型组织,强调以数据为生产要素。在业务决策中,以事实、指标和数据作为核心指导,而业务人员是以辅助角色支撑数据驱动业务。数据辅助数据驱动业务系统数据中台驱动业务人员辅助业务系统业务人员流程数据经验决策辅助6数据驱动型组织是以数据为生产要素的组织,以数据驱动业务,实现持续增长和创新发展,以重塑组织的生产力。数据驱动型组织的定义以数据为生产要素数据驱动型

4、组织将数据视为企业资产,最大程度上利用数据的价值,关注数据的完整性、关联性以及数据质量。数据驱动决策数据驱动型组织在进行关键业务决策时,以数据为基础,通过高质量的数据分析驱动业务,而不是凭借经验或将各类信息简单堆砌。数据驱动型组织数据驱动创新数据驱动型组织注重知识沉淀和传承,以保证业务的持续创新能力,并在开辟新的业务时,以知识为起点,通过认知智能实现智能化创新。PagePage7实现数据驱动业务,核心在于构建数据能力从数据生产要素到数字资产,进而以数据驱动业务,落地业务价值,核心在于构建数据能力。海量、分散、多元化数据数据驱动业务数据驱动运营数据驱动创新数据驱动决策企业经营数据客户行为数据设备

5、运转数据生态合作数据数字资产数字资产是以电子数据形式存在并且预期会给资产持有者带来经济利益或具有潜在经济价值的非货币性资产。落地业务价值构建数据能力整合、治理、洞察标准、统一、价值数据中台是数据能力建设的核心支撑Page8 随着数字化进程的持续推进,企业数据意识增强,越来越多的企业对于数据中台的价值形成共识。对于数据驱动型组织,数据能力建设涉及数据的整合、治理、洞察与安全,需要以数据中台为支撑,盘活全域数据。数据中台成为核心业务系统。数据驱动型组织,数据是关键生产要素,进行数据治理的数据中台嵌入业务流程,已然成为核心业务系统。基于数据中台,企业具备面向全域数据、面向数据全生命周期的管理、治理和

6、价值挖掘能力,进而以数据驱动业务,落地业务价值。应用场景数据中台数字资产数据源数据整合数据治理数据洞察数据采集层金融政府与公共服务消费品与零售营销IT运维财务垂直行业通用职能非结构化数据成为增长主力Page9根据Gartner分析,企业80%的数据将会由非结构化数据构成。在数据爆炸式增长的当下,蕴含可观价值信息的非结构化数据,成为数据驱动型组织数据的增长主力。数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等。非结构化数据的定义非结构化数据的特点 海量数据规模,且数据存储占比

7、高 数据来源丰富,分散各个系统非结构化数据结构化数据非结构化数据知识图谱数据全域数据机器数据传统的非结构化数据管理,内容对象、元数据与索引是分离存储和独立管理,难以同时灵活横向扩展,加剧海量非结构化数据的管理复杂性。非结构化数据的特点与挑战Page 10海量多样对于非结构化数据而言,形式多样关系复杂,基于常规单一算法技术很难识别、分析。异构非结构化数据,结构形式复杂,实体和关系分离,建立非结构化数据知识图谱体系以进一步挖掘深层次价值面临巨大挑战。业务数据孤岛、知识数据孤岛、桌面数据孤岛三大数据孤岛使得文档数据分散储存,无法统一管理,难以快速准确地搜索,业务系统重建数据难以整合。分散Page 1

8、1非结构化数据管理需要革新的底层架构 非结构化数据管理需要将底层数据打通,从源头保障数据资产的复用能力,实现数字资产统一运营、全面合规、高效利用。从数据库到数据仓库、大数据平台,传统数据架构并非面向非结构化数据设计;再演进到结构化数据中台,非结构化数据处理能力仍然是瓶颈,非结构化数据需要革命性的数据架构。仅仅依靠数据分析技术难以解决问题,必须将计算机视觉、NLP、知识图谱等技术融入其中,借助深度学习等人工智能技术实现数据治理,进而实现知识复用与智能搜索。底层数据挑战数据架构挑战智能技术挑战非结构化数据中台非结构化数据中台兴起Page 12 非结构化数据中台对文档、图片等非结构化数据进行汇集,融

9、合人工智能技术,基于先进的数据架构底座,对非结构化数据进行整合、治理、洞察形成数字资产,进而赋能各行各业应用。非结构化数据中台数字资产数据整合数据治理数据洞察数据源文档、图片等非结构化数据人工智能驱动数据架构底座应用场景金融政府与公共服务消费品与零售营销IT运维财务垂直行业通用职能02非结构化数据中台助力数据驱动型组织中国非结构化数据中台实践白皮书V2数据驱动型组织面临的非结构化数据挑战非结构化数据中台解决方案Page 14数据驱动型组织的两大需求对于数据驱动型组织而言,数据已然具备生产要素的地位,实现数据的资产化、知识化,是打造数据驱动型组织的核心支撑。数据价值挖掘是数据资产化、知识化的基本

10、路径,在数据价值挖掘的同时,数据驱动型组织必然着眼数据安全问题,数据安全业务合规是数据驱动型组织实现数据驱动业务的根基。因而,对于数据驱动型组织,数据价值挖掘、数字资产安全管理都是不可忽视的需求。数据是数据能力的核心。数据量、数据的使用程度、内化数据的过程都是数据驱动型组织构建数据能力的考量因素,而能否有效地挖掘数据价值尤为关键。数据资产安全是构建数据能力的根基。落地数据驱动型组织,数据资产至关重要,而最大限度地保护数据资产安全,是数据驱动决策赋能业务的基础。数据价值挖掘数字资产安全Page 15数据价值挖掘诉求是分阶段的数据洞察阶段 3数据治理阶段 2数据整合阶段1整合不同终端数据,打破数据

11、孤岛,对数据进行统一存储管理识别捕获数据信息,并基于有序的制度和组织,实现数据的管理与应用构建知识网络,建立数据间的关系,深入挖掘数据价值对于一个企业而言,数据价值挖掘是战略层面的规划,是一项长期工作。对于整个非结构化数据中台的建设,更多的企业选择从顶层设计出发,逐级分段建设。根据企业自身的业务目标逐级建设,从底层场景领域、从优先场景领域切入,逐步纳入更多的业务模块,以达到企业数据能力的逐级进化和价值的持续叠加。面对海量非结构化数据,企业对于数据价值挖掘的诉求主要分为三个阶段:数据整合、数据治理、数据洞察三个阶段。Page 16非结构化数据价值挖掘的业务挑战挑战数据洞察数据治理数据整合 海量非

12、结构化数据的访问与查询存在巨大挑战;跨地域统一内容管理易网络拥塞,访问难;类型各异、存放在异构环境中的非结构化数据进一步加大管理难度。挑战 数据类型多样,对于数据信息识别、内容提取面临挑战;内容与业务割裂,数字化服务能力缺失,内容无法自动流转,人力投入成本高。挑战 复合内容难以有效识别与组织利用;隐性知识难以有效识别、表达及获取,精准描述关键信息难度大;非结构化数据知识体系复杂,基于知识网络洞察数据价值面临巨大挑战。Page 17数字资产安全需要立体安全企业需要搭建包括数据安全、访问安全、信息安全等在内的立体安全体系。个人信息保护法,2020 数据安全法,2020 上市公司信息披露管理办法,证

13、监会 通用数据保护条例,欧盟,2018(GDPR)个人隐私数据企业敏感信息非法内容管控信息安全 电子公文归档管理暂行办法,2003 商业银行资本管理办法,2013 金融企业业务档案管理规定,2015 药品生产质量管理规范,2010(GMP)内容边界安全内容访问审计跨网跨地域多文档域访问安全访问安全实时杀毒数据备份恢复 网络安全法,2017 信息安全等级保护管理办法,2007 涉及国家秘密的信息系统分级保护管理办法,2005数据安全Page 18数字资产安全的业务挑战 海量文件或小文件的备份和恢复性能严重不足,内容数据缺乏高效的保护方案文件备份性能不足 形态各异的病毒无孔不入,企业的数据安全面临

14、高危风险病毒攻击风险 企业在内容流转过程中没有统一的方式进行访问边界控制,机密信息识别、流转安全保护尚不完善,无法进行访问安全全面管控访问安全挑战 敏感内容、个人隐私数据、非法信息难以识别与监管,靠人工识别管控工作量大效率低,经常发生主动或被动的泄密敏感内容泄漏信息安全访问安全数据安全Page 19非结构化数据中台解决方案助力数据驱动型组织应用场景 非结构化数据中台对对象数据、元数据、索引数据进行汇集、管理,融合人工智能技术,提供先进的数据架构底座,构建非结构化数据能力。非结构化数据中台基于双路径建设,实现数据的资产化、知识化,服务于企业多业务主题场景,包括文档管理、业务赋能、知识创新等。非结

15、构化数据中台人工智能驱动数据架构底座对象数据池元数据池索引数据池知识创新文档管理内容赋能金融政府与公共服务消费品与零售营销IT运维财务垂直行业通用职能数据整合数据治理数据洞察数据价值挖掘数据安全访问安全信息安全数字资产安全Page 20非结构化数据中台基于双路径建设实现数据的资产化、知识化数字资产安全数据价值挖掘数据整合数据治理数据洞察数据资产化知识化数据安全访问安全知识安全非结构化数据Page 21整合、治理、洞察非结构化数据的中台数据价值挖掘路径,非结构化数据中台主要基于业务主题落地,实现数据的整合、治理、洞察,进而实现资产化、知识化,非结构化数据中台涉及的业务主题主要有文档管理、内容赋能

16、、知识创新。数据治理数据洞察非结构化数据中台 整合终端、业务系统、存储上的所有非结构化数据 在非结构化数据生成时即时治理文档管理体系、内容赋能体系 利用知识图谱、自然语言处理等人工智能技术洞察非结构化数据知识创新体系底层数据源数据整合Page 22立体安全的非结构化数据中台基于非结构化数据中台底层架构,集成数据安全、访问安全、信息安全不同层面的数字资产安全方案,从安全维度支撑非结构化数据中台的资产化、知识化。非结构化数据中台数据安全 高性能备份恢复 实时杀毒数据安全方案访问安全 统一的权限及安全策略 开放的防泄密集成 密级管理 访问审计访问控制及安全方案信息安全 敏感内容管控 隐私信息保护 内

17、容脱敏AI技术驱动的信息安全方案Page 23数据安全方案:数据备份恢复面向海量非结构化数据,基于对象存储的备份恢复方式面临巨大挑战,一是备份性能慢,二是恢复性能慢,而数据备份恢复性能低下的根本原因在于单位时间内磁盘的吞吐率无法提升。备份数据中心异地灾备中心OAERP数据采集PLMMobilePCIM内容采集文档上传对象数据关系数据元数据OSS网关对象聚合技术备份数据库编排调度服务灾备对象存储恢复备份恢复应用一致性任务调度爱数数据安全方案采用OSS网关对象聚合技术,并结合编排调度服务,提出高性能备份恢复方案,相比传统的NAS、对象存储备份恢复技术,性能得到数十倍的提升。关键业务系统Page 2

18、4数据安全方案:实时杀毒病毒无时无刻不威胁着企业数据安全,实时杀毒是数据安全的首要任务。OpenDoc APIClient/APP/WebManagement API内容生产WindowsMaciOSAndroid终端OAERPIMPLM业务系统消息服务杀毒引擎服务业务场景Alita引擎内容流历史版本一键恢复数据中心消息服务存储服务内容开放框架指定文档库杀毒定时/实时杀毒实时杀毒爱数基于数据备份、杀毒引擎服务、消息服务等手段,实现指定文档库杀毒、定时/实时杀毒。Page 25访问控制及安全方案非结构化数据的跨网流转大幅提升操作易用性及业务效率,而保证跨网的多文档域安全数据交换,需要建立统一、安

19、全、可控、便捷的跨网数据交换通道。跨网环境数据交换场景,即有网络设备隔离,数据被下载之后会进行打包和加密,以保障传输过程中的文档安全。支持添加多个平级域,多个平级域之间可自行确认同步数据。可以支持的网络隔离设备,包括网闸、光闸、防火墙、摆渡机、隔离器。爱数方案特性说明文档域A文档域BAnyShareAnyShare元数据服务器对象存储管理控制台部署控制台元数据服务器对象存储管理控制台部署控制台跨域文档库交换单导设备网络隔离设备下载研发区域数据处理存储节点存储节点办公区域对象存储对象存储文档集服务Page 26AI技术驱动的信息安全方案传统隐私数据识别、监控及保护主要基于人工管控,但随着非结构化

20、数据积累,基于AI技术进行隐私数据识别、隐私数据定级、隐私数据监管,成为最有效的信息安全方案。爱数信息安全方案智能识别立体监控高效保护 隐私内容自动智能识别 隐私文件风险等级自动智能评估 实时、分层、多视角 企业隐私分布及风险动态“一目了然”AS非结构化数据中台自带隐私保护功能,无感实现隐私数据识别和保护,极大节约人力管控成本 支持DPO一键式合规设置,灵活适配CCPA、GDPR、个人信息保护法等法规要求,极大降低合规体系建设成本生产系统文档应用OAERPPLM终端WindowsMacWORDExcelPDF隐私数据识别web业务数据办公数据InfoInsight业务应用主文档隐私数据定级隐私

21、状态监管文档所有者DPO查看文档隐私类别查看文档隐私详情组织隐私分布状态监控部门隐私统计信息查询组织隐私管控策略设定智能识别立体监控高效保护03非结构化数据中台的应用场景中国非结构化数据中台实践白皮书V2文档管理内容赋能知识创新Page 28基于非结构化数据中台的业务主题主要有:文档管理、内容赋能、知识创新等,不同业务主题之下包含更为具象的应用场景。在不同应用场景中,数据驱动型组织需求侧重虽有不同,但都有数据价值挖掘、数字资产安全两个维度的需求考虑,需要基于非结构化数据中台进行数据价值挖掘、数字资产安全管理,实现不同应用场景下的业务赋能、业务合规。非结构化数据中台应用场景文档管理内容赋能知识创

22、新应用场景业务主题非结构化数据中台数据价值挖掘数据整合、治理、洞察数字资产安全管理数据、访问、知识安全 定义:沉淀业务系统的内容,实现业务流程自动化。典型应用场景:表单自动采集、电子发票管理、合同管理与合规、信贷业务管理等。定义:在数据沉淀基础之上,实现数据知识化,落地知识运营管理。典型应用场景:产品咨询、员工培训、项目竞标、知识共享交流等。定义:沉淀结果性文件,提高文档搜索与部门协作效率。典型应用场景:设计文档管理、客户数字资产生命周期管理、协作办公等。案例文档管理:业务挑战文档散落存储在个人PC、文件服务器、业务系统存储、分子公司各地方,无统一检索,无统一存储机制,对日常办公管理带来极大不

23、便;缺乏有效的内容安全管控、在线杀毒、合规审计、备份容灾等机制,存在丢失与泄密风险。业务系统(OA,CRM,SAP,HR,邮箱系统等)笨重缓慢,随着业务系统附件逐渐增多,缺乏合理的文档归档机制。例:制造业/新能源某新材料集团股份有限公司是一家锂离子二次电池用正负极材料专业化生产厂家,近年来集团业务规模快速发展,传统的文档存储和管理模式面临巨大挑战。Page 29随着数字化转型的持续深入,文档数据种类多样,持续积累,成为数据资产不可忽视的重要组成部分,而传统的文档存储和管理模式已不再适应当下文档管理需求。文档管理场景业务挑战主要聚焦于文档统一管理、安全合规、数字资产沉淀三个方面。存储资源重复建设

24、,可扩展性差;文档管理脱离业务活动,无法实现文档生命周期流转,持续沉淀数字资产。挑战3:数字资产沉淀 海量非结构化数据散落于不同终端、业务系统甚至异地,无法统一管理,内容搜索效率低。挑战1:文档统一管理 缺乏有效的内容安全管控、在线杀毒、合规审计、备份容灾等机制,存在丢失与泄密风险。挑战2:业务合规文档管理:解决方案文档管理解决方案对所有结果性文档统一管理,并规定管理权责、权限以及规范,以实现文档从创建到使用流转,再到最后归档销毁的全生命周期管理。在数字资产安全方面,文档管理业务场景主要涉及数据安全、访问安全需求,需要建立内容安全管控、在线杀毒、合规审计、备份容灾等机制,满足业务合规要求。Pa

25、ge 30关键业务系统OAERP终端WindowsMac非关键业务系统项目管理扫描打印机数据采集业务合规数据应用数据安全内容总线内容数据湖数字资产管理文档统一管理非结构化数据中台访问安全智能搜索自动分类文档管理:爱数全生命周期解决方案文档管理解决方案的核心是文档全生命周期管理。全生命周期管理,是指基于与业务活动一致的流程设计,实现文档从创建到使用流转,再到最后归档销毁的管理,以爱数全生命周期管理方案为例进行说明。Page 31分类使用归档智能内容分析及检索标签摘要元数据识别搜索团队协作空间个人办公空间文档库统一管理规范归档库业务导向加持加持文档外发安全协作移动办公业务系统调用非法内容管控文档电

26、子化管理数据赋能业务运营数据赋能业务运营延续/修订/废止/删除到期可见可见易用易用高效协作安全合规文档不丢失统一统一存管存管扫描仪打印机其他终端获取电脑桌面MacWindowsLinux移动终端项目资料归档库票据电子影像归档库音视频文件归档库企业文化资料归档库文档管理:业务价值 实现文档电子化,面向业务、组织部门的业务诉求形成不同的文档分类管理和规范流程,提高运营效率 针对行业合规要求,建立针对性合规管理体系,充分覆盖文档共享发布、文档留存及备份保护各个环节,建立安全设计体系,满足业务合规要求。基于业务体系建立文档管理体系,持续沉淀组织核心数据,赋能不同岗位、不同业务领域,促进知识沉淀和复用。

27、提升生产力业务合规沉淀核心数据制造业/新能源Page 32 提升效率:研发及办公协同效率 合规:为ISO27001中文档管理打好合规基础例:某新材料集团股份有限公司基于爱数非结构化数据中台实现的业务价值Page 33文档管理:某化工勘察设计企业案例业务挑战:该企业是国家级化工勘察设计单位,主要业务包含技术研发、工程总承包、实业运营、国际贸易和投融资等。企业现采用传统文件管理系统进行工程项目文件管理,随着文件持续累积,传统文件管理系统面临挑战。文档数据采集量不足10%文档系统速度慢,用户体验差,文档安全合规管理混乱;不支持云计算架构和海量数据存储;无标准API接口,无法对接新业务系统;对非文档数

28、据认识不足文档数据采集挑战 文件检索效率低权限规则不灵活,颗粒度不细;缺少复杂搜索的能力;知识能力薄弱缺少自动化的内容理解能力,全靠人力整理;知识交付能力薄弱;无法满足客户需求境外项目调用文件的速度和合规要求无法满足;多通过国外网盘管理文件。文档数据使用挑战文档管理:某化工勘察设计企业案例Page 34解决方案:非结构化数据中台AnyShare采集结果型文件、过程型文件以及关键业务系统数据,基于内容数据湖、内容集成开放框架等实现海量非结构化数据存储、智能内容搜索以及内容安全合规。收益:文件的跨系统调用时间缩短至原来的十分之一;将数TB图纸、报告、说明等非结构化数据统一管理,实现文档全生命周期的

29、保护,满足合规性要求;提供强大的全平台搜索能力和在线预览服务,海量文件随用随搜,搜索结果随时预览;促进知识积累、留存、复用,为实现知识运营筑基,赋能业务。结果型文件每年产生量论文归档文件入库图纸300篇100G15万张数据汇聚过程型文件需求说明概要设计施工进度报告数据汇聚在线编辑和预览服务内容集成开放框架内容分析及检索服务内容数据湖非结构化数据中台关键业务系统数据调用OADPMPMS4.0DMS知识运营API集成办公文档和业务文档知识化海量知识沉淀项目资料自动、合规流转员工/合作伙伴培训赋能智能知识查找智能知识推荐数字化服务能力业务合规内容赋能:业务挑战Page 35内容赋能核心在于智能识别提

30、取业务系统内容,实现业务流程的自动化。内容赋能业务聚焦于聚焦于业务系统整合与治理、业务流程自动化、业务应用开发三个方面,面临数字化服务能力、IT管理、使用者体验、一致性风险以及业务合规等挑战。大量的内容受困于孤立的业务应用中,缺失内容服务能力,无法适应多样化的业务发展和用户使用要求,内容价值无法体现。面 对 国 内 外 日 益 严 格 的 合 规 要 求(GDPR,个人隐私安全法),各个业务系统中碎片化存在的内容,蕴含着大量合规风险无法有效识别。IT管理 业务系统与文档脱离,系统间接口过于复杂,易形成内容蜘蛛网,维护难度巨大,缺少标准化内容管理规范进行统一管理。一致性风险 内容在不同业务系统中

31、流转,需要人工覆盖割裂的环节,带来内容一致性的风险。使用者体验 内容在不同的业务系统中碎片化存在,形成孤岛,无法实现跨业务的统一使用统一检索的体验。内容赋能:解决方案Page 36非关键业务系统项目管理扫描打印机终端关键业务系统OAERPWindowsMac内容采集内容赋能表格数据文档的文本影像数据内容提取数据转换OCR图谱标签内容数据内容元数据内容分析数据内容总线内容数据湖内容管理体系架构内容提取数据转换OCR图谱标签流程自动化业务数据贯通电子档案管理合同管理SAP内容管理流程自动化业务数据贯通电子档案管理合同管理内容处理服务网智电子档案管理OCR内容识别方案拓维合同管理方案SAP智能内容管

32、理内容生态应用非结构化数据中台基于非结构化数据中台能力,集成OCR等第三方生态应用,实现内容赋能业务运营。内容赋能:业务价值 内容与业务结合,提高业务运营效率。内容数据结构化,自动化流转,降低人力投入。充分利用内容价值,实现数据资产化,赋能更多业务场景。提升生产力 统一内容服务能力赋能给各业务系统,避免重复造轮子。内容总线架构,显著降低业务集成复杂度,敏捷式构建统一内容管理。降低TCO 内容基于业务自动流转,避免人工参与带来的合规风险。统一内容管理,解决各业务系统在非结构化数据管理方面的短板,实现内容安全管理、高性能备份、归档等合规要求。业务合规某保险集团:“业务+数据”双中台实现7个主要业务

33、系统的线上数据整合,设计面向业务自主分析的6大主题数据集,报表查询效率由原先数分钟提升至秒级;实现线下5T文件资料的文档云集中管理,探索线下数据价值应用连接业务中台,业务文档全流程打通,自动流转,合规且高效预览、属性查询等服务直接调用,告别重复造“轮子”理赔在线体系集团项目管理系统承保在线系统账单与结算在线系统Page 37合同管理场景:某制造业企业案例Page 38业务挑战:某制造业企业的市场部负责合同的录入以及合同筛选支撑销售招投标,业务人员较少但合同数量持续增长,合同管理面临挑战。人工录入合同,效率低,人工成本高;制造业合同包含大量非结构化数据,无法直接检索需要人工逐一识别,处理效率低;

34、合同内容与ERP系统供应明细存在不一致现象,需要人工对合同内容逐一审查。收益:录入合同、辅助销售找寻对应合同人力投入下降50%,且人力主要用于合同关键信息的校正确认,查找投标用的合同证明完全基于中台实现;保留下来的合同电子件及其内容元数据信息,还可用于更多业务场景,比如大量的合同内容需要进行内容合规和风险审查,也可以基于一个基础平台进行拓展。CRM系统合同扫描件PDF?合同编号及链接?合同管理系统合同各类关键信息合同中供应明细AnyShare Family 7 智能内容云合同扫描件A合同扫描件B合同扫描件C?图片自动标签图片OCR识别图片摘要?投标文件电子版PDF合同管理场景:某运营商案例业务

35、挑战:某运营商合同管理系统的用户规模超40万,年新增合同100万份+,合同合规面临巨大挑战:合同拆分逃避审批难察觉,合同审批比对费时费力(电子合同、合同数据、打印合同),海量合同履约风险,基于合同的关键条款识别与任务匹配难。解决方案:基于AnyDATA构建合同知识网络,识别合同内容条款知识以及合同关联公司、项目对象,与合同法律法规内容进行匹配,识别合规风险,主要用于合同及合同方关系分析及风险管理、合同条款内容合规性及风险发现。知识提取:合同结构化内容数据湖内容文本文本标签、分类、摘要内容数据内容分析服务合同分类甲方:xx乙方:yy标的物:zz金额:M定金:N签订日期:DD免责条款:无内容数据合

36、同管理系统风险分析与评估 数据一致性检查;条款完备性检查;条款准确性检查;履约合规性检查;关联公司异动风险检查;合同起草合同审批OCR识别与自动录入合同上传合同定稿合同履约激活业务人员审批人员监管人员元数据同步履约风险提醒业务人员合同知识网络合规性检测服务于审批、履约管理Page 40知识创新:业务挑战例:某集团企业原有知识管理现状与痛点 积累几TB的文件,大量的标签,全文检索异常慢,文档稍微大一些就需要下载查看,用户体验极差。每个部门设置知识管理员,定期收集业务知识文档,繁琐、低效、业务骨干繁忙配合不够,每次领导发话推动的运动式收集稍有成效。每次收集文档打标签、上传到分类编目非常麻烦,知识标

37、签库维护异常纠结;用户活跃度低,经常反馈需要的找不到想要的知识和文档,看到的版面千篇一律;科技企业对于数据驱动型组织而言,数据知识化可以推动学习型组织建设,赋能业务运营,更进一步以知识网络为核心挖掘数据价值,驱动业务创新,支撑战略决策。知识创新场景之下,实现数据知识化面临知识层面的多项挑战。海量知识的管理、拓展、安全性挑战用户和场景导向的个性化推荐挑战 传统系统架构侧重应用逻辑,难以应付海量文档管理、拓展和安全性挑战。传统知识搜索不支持细粒度知识抽取、管理、分析;也无法支持用户搜索意图理解,难以快速、精准找到需要的知识。针对知识的关联和个性化推荐需求迫切,建立精确有效的知识网络支持业务赋能面临

38、挑战。知识收集、整理依赖人工 桌面文档知识完全依靠定期收集、整理、大量业务过程的桌面文档知识完全依靠人工收集、整理,员工不胜其烦,难以持续;传统知识分类、标签主要依靠人工整理和编辑,工作量大,成效堪忧;智能化知识搜索挑战Page 41知识创新:解决方案智能知识运营方案助力知识创新体系建设。以爱数案例为例,通过AnyShare实现海量内容数据的汇聚,并利用自然语言处理和知识图谱等人工智能技术,由AnyDATA构建企业私域数据知识网络,形成一个千人千面、个性化、智能化的知识中心,并通过智能知识整合场景赋能业务系统和流程。第三方业务/培训系统:内嵌知识应用概念知识智能搜索个性推荐自动标签非法内容管控

39、隐私数据识别企业知识中心 Knowledge Center支撑支撑支撑知识网络知识抽取服务模型训练服务知识标注服务意图理解能力知识搜索能力个性推荐能力知识图谱内容平台提炼知识库团队内容协作文档管理内容管理知识库A知识库B知识库N用户画像文档对象概念对象主题知识卡片知识文档卡片个性推荐知识社区文档知识化智能分析推荐业务对象OfficePDF智能表格文档库A文档库NPage 42构建企业私域数据知识网络,打造企业知识大脑客户3客户4客户1客户2关系 A关系 B关系 C关系 D客户图谱项目1项目3项目4项目2关系 A关系 B关系 C关系 D项目图谱条款1条款3条款4条款2关系 A关系 B关系 C关系

40、 D合同规则知识库结构1结构3结构4结构2关系 A关系 B关系 C关系 D结构专业图谱友商3友商4友商1友商2关系 A关系 B关系 C关系 D情报图谱找客户内部市场文档外部市场文档找项目内部项目资料外部相关项目找友商内部竞争分析外部情报信息精准知识搜索与智能推荐企业私域数据知识网络知识网络知识服务客户系统/项目管理系统/服务系统业务关系模型知识主题/标签文档知识模型文档知识库知识主题、知识文档Page 43知识创新:业务价值Page 43缩短工作交接时间缩短工作培训时间节省培训费用知识复用提高效率、节省成本问题重复发生率降低节省成本隐私保护业务合规提高工作效率例:某高科技公司基于爱数非结构化数

41、据中台实现知识运营的业务价值定量衡量 现有员工1000余人,约500人使用知识管理系统,在知识搜索、工作交接、新岗培训层面,大约可节约40000工时/年;公司全员培训费用为每人约3500元/年,通过知识管理系统进行共享学习和经验交流,可以提高培训效果以及减少外出,保守估计可降低25%的培训支出;技术中心研发类报告编制时,知识复用程度大幅提高,在同等工作强度下,知识产生的数量较往年有37%增加,质量未受到影响;通过问题事后学习,事前预防,有效规避研发制造过程中出错的概率,较以往节约研发和测试成本1.4亿/年;科技企业业务挑战:该企业从事建筑方案设计、施工图设计,属于知识密集型企业,基于知识沉淀实

42、现知识运营是落地数据驱动型组织的关键。该企业知识管理面临的问题主要有:如何快速准确找到设计参考资料包括设计图片、如何减少知识整理的手工工作量、设计新人学习,如何让知识找人。解决方案:知识运营整体方案包含AnyShare Enterprise内容平台、AnyDATA知识网络、AnyShare Knowledge Center知识中心应用三大产品组合形成,分别对应内容管理平台、知识网络以及知识运营中心,形成一个现代化、智能化的知识创新体系。知识创新:某建筑设计企业的项目知识运营大量内外部设计参考资料,设计过程资料,特别是设计效果图,如何快速服务于新的设计项目,需要精准知识搜索、图片搜索。精准知识与

43、图片搜索不能接受维护标签库、打标签大量的人肉运营工作,必须自动化。简化运营复杂性,设计师繁忙,重点围绕专业主题/知识交流互动,简化知识整理和运营互动避免千篇一律的知识门户,希望根据用户角色、岗位、爱好,实现个性化的知识推荐。让知识主动找人AnyShareKnowledge CenterAnyShareEnterpriseAnyDATA知识中心内容管理平台知识网络文档统一生命周期管理、数字资产安全;文档过程共享协作与知识自动归集;统一文档知识库;文档智能检索、图片智能检索;基于业务标签的知识主题自动生成文档与知识主题自动归集;基于标签的知识主题与知识文档推荐基于用户画像的知识主题与知识文档推荐知

44、识卡片:知识主题、知识文件;知识运营:社区式分享、激励、互动问答解决方案文档知识化智能分析推荐Page 44Page 44知识创新案例:智能的知识与图片搜索经过业务知识关系优化的知识精准搜索推荐;经过机器学习训练的建筑设计图片智能检索;基于知识网络的精准知识搜索推荐(搜索意图匹配:搜索关键词与知识标签直接及间接匹配度越高,越接近用户搜索意图,推荐越精准)面向建筑设计行业的图谱智能检索(经过大量机器学习,搜索图片内相关建筑样式、风格,实现以图搜图、以文搜图)知识创新案例:千人千面的知识中心千人千面的知识主题、知识文件推荐(用户画像、知识主题与标签:来自知识网络)知识主题自动发现、文档自动关联、专

45、家互动(主题发现、自动关联:来自知识网络)知识主题发现和描述生成,减少主题编辑工作量;知识主题与AnyShare知识文件自动关联,减少上传归集工作量;知识主题、知识文件基于用户画像自动推荐;知识创新案例:社区式知识圈知识专家交流互动:知识问答本知识文件所在知识主题下其他知识文件(相关文档推荐)知识评论互动包含本知识文件的其他知识主题(主题标签的相关推荐)社区式知识圈:知识主题互动、知识文档互动、知识专家互动;无处不在的关联推荐、个性化推荐;04非结构化数据中台的建设指南中国非结构化数据中台实践白皮书V2非结构化数据中台建设方法论非结构化数据中台的具体建设路径Page 49非结构化数据中台建设方

46、法论非结构化数据中台是企业数据创新运营的体系,需要从战略、组织架构、建设内容等方面进行考虑,并需要一套完整的实施交付方法论实现战略到业务的落地。战略组织运营技术体系数据体系服务体系运营体系体系规划需求调研蓝图绘制开发交付持续运营战略非结构化数据中台需要定位于企业级战略。组织运营非结构化数据中台需要企业组织运营架构提供必要保障支撑。内容 非结构化数据中台的建设主要包括技术体系、数据体系、服务体系和运营体系等内容。交付方法论包括体系规划、需求调研与蓝图绘制、开发与交付、持续运营。Page 50中台战略中台建设是一个战略项目,是一个变革项目,需要从顶层规划开始,自上而下推动。制定中台战略,业务战略、

47、数据战略以及战略落地保障是三个重要考量维度。战略落地保障 数据中台战略落地需要有相应的文化、制度、流程、资源的保障。数据文化是重视、实践、鼓励使用数据来改善决策的集体信念和行为,比如分享和社区的建立。制度、流程层面,主要在于优化,以适应数据中台引入的新业务模型。资源层面,包括基础设施资源、技术储备、人才资源等。从业务战略切入 数据中台建设始终围绕业务价值,而中台战略的制定也需从业务战略切入。明确数据中台的价值。基于业务战略规划,明确数据中台在业务战略实现过程中的价值,制定数据中台项目落地评价指标。设定用例规划。基于业务战略规划开发场景的优先顺序,挖掘对客户和企业最具价值的领域以及核心应用场景。

48、制定数据战略 数据是企业的战略资产,结合业务梳理制定全面清晰的数据战略,是数字化转型的基础。梳理企业数据流全貌,包括系统类型,存储方式,访问频率,价值高低等,指导企业数据规划:价值识别、采集存储、处理加工、分析挖掘、交易使用 建立数据治理体系,数据治理包括战略层的标准和流程制定、数据基础架构技术战略管理、统一的集成交换技术标准等。Page 51组织运营架构建设数字化正在重塑人们的工作形态,非结构化数据中台所包含的技术、组织、方法论的革新衍生出全新组织运营架构需求。重塑组织运营架构,主要需要思考数据中台由谁来建、谁来维护、谁来经营、业务需求如何承接、效果怎样衡量等问题。中台的建设、维护、运营以及

49、业务的承接、中台服务的推广等,需要建立数据中台团队支撑;同时,业务、后台、管理等团队需要有对应的组织人员与中台团队对接,以适应企业中台运转模式。数据中台企业高层支持推进建设团队维护团队运营团队产品团队业务团队中台组织运营架构后台团队管理团队业务团队Page 52数据中台的内容数据中台建设的核心是内容建设,是可呈现的产出物,也是数据中台的价值所在。数据中台的建设内容包含技术体系、数据体系、服务体系、运营体系四大体系。技术体系主要是指数据基础架构,为企业数据治理与服务提供技术平台和能力。分为两个层面,大数据存储计算技术与数据中台工具技术组件,工具技术组件是核心关注点。数据体系是数据中台建设、管理、

50、使用的核心要素。数据中台始终围绕数据体系的建设和使用,针对不同企业的不同业务,建设不同的数据体系。技术体系数据体系 服务体系是通过数据中台的服务组件能力,把数据变成一种服务能力,让数据能够方便地参与到业务中并为业务带去价值。运营体系包括平台流程规范执行监督、平台资源占用的监管及优化推动、数据质量的监督及改进推动等,是数据中台得以健康、持续运转的基础。服务体系运营体系Page 53TPA交付方法论T(Think)-P(Plan)-A(Action),是从企业的数据驱动战略以及业务模式出发,为企业提供专业的端到端的咨询、开发和交付的服务方案,并通过大数据基础设施进行有效落地,帮助客户实现数据驱动战

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服