收藏 分销(赏)

生成式AI时代下的数据战略白皮书.pdf

上传人:Stan****Shan 文档编号:1244857 上传时间:2024-04-19 格式:PDF 页数:48 大小:3.37MB
下载 相关 举报
生成式AI时代下的数据战略白皮书.pdf_第1页
第1页 / 共48页
生成式AI时代下的数据战略白皮书.pdf_第2页
第2页 / 共48页
生成式AI时代下的数据战略白皮书.pdf_第3页
第3页 / 共48页
生成式AI时代下的数据战略白皮书.pdf_第4页
第4页 / 共48页
生成式AI时代下的数据战略白皮书.pdf_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、生成式 AI 时代下的数据战略目录生成式 AI 飞速发展,开启企业全面重塑新时代人工智能发展迎来新拐点,将深刻改变未来商业模式企业积极探索生成式 AI 应用,机遇与挑战并存 0102030504迎接生成式 AI 时代,重新审视企业数据战略面向生成式 AI 应用,企业数据战略需把握四大关键点 关键点之一:找准应用方向,激发创新价值关键点之二:准备专有数据,确保数据安全关键点之三:驱动数据管理,打造最佳实践关键点之四:重构基础设施,实现高效运营埃森哲携手亚马逊云科技,助力企业解锁生成式 AI 价值助力企业重塑数据战略,赋能 AI 加速释放潜力新战略,新技术,新方式总结383440464910202

2、5353035414345424462业界探索实践海尔创新设计中心打造中国首个 AIGC 工业设计解决方案 西门子携手亚马逊云科技构建企业级智能知识库应用 科思创基于 Amazon CodeWhisperer 提升代码开发效率 全球知名跨国银行通过生成式 AI 减少交易后电子邮件数量,提高效率和客户满意度 生成式 AI 为大型保险公司重塑运营平台和合同管理01生成式 AI 时代下的数据战略3生成式 AI 飞速发展,开启企业全面重塑新时代4生成式 AI 时代下的数据战略人工智能发展迎来新拐点,将深刻改变未来商业模式生成式 AI 正在唤醒全球对人工智能变革潜力的认知,激发起前所未有的关注和创造力浪

3、潮由于大语言模型具有处理大规模数据集的能力,它可以“掌握”企业长期以来积累的所有信息,包括创办至今的发展历程、业务特点和商业意图,甚至细致到产品、市场和客户。所有用语言记录传达的内容,如应用、系统、文档、电子邮件、聊天、视频和音频等等,都将进行创新、优化和重塑,最终走向全新的高度。根据埃森哲调研,74%的全球商业领袖高管表示,将增加在数据和 AI(包含生成式 AI)方面的投入,这一比例较 2023 年大幅跃升了 24 个百分点。在中国的受访高管中,同样有高达 71%的人持以同样态度。“生成式 AI 将创造巨大价值”已经成为绝大多数企业高管的共识。1ChatGPT、文心一言、通义千问、DALLE

4、、Stable Diffusion 等一系列易于使用的生成式 AI 服务,正在迅速推动技术在商业领域和社会公众中的普及,这将对企业产生极为深远的影响。ChatGPT 推出仅两个月,月活跃用户就达到了 1 亿,成为有史以来增长最快的消费 应用程序。埃森哲研究发现,所有行业中 40%的工作时间都将得到 GPT-4 等大语言模型的协助。这是因为,语言任务占到了企业人员工作总时长的62%,其中 65%的时间可以借助生成式 AI 和自动化技术来提升工作活动的生产力。2从对话到行动:生成式 AI 的五点共识,埃森哲,2023,https:/ AI 的方式和地点98%3的全球高管认为,人工智能基础模型将在未

5、来 3 到 5 年内在其组织的战略 中发挥重要作用。97%4的全球高管认为人工智能基础模型将实现跨数据类型的连接,彻底改变人工 智能的使用地点和方式。6/105受调查的 10 个组织中,有 6 家计划将 ChatGPT 用于学习目的,超过一半 的组织计划在 2023 年进行试点案例。超过十分之四的人希望进行大量投资。5/22622 个职业类型中,有 5 个将受到人工智能大量影响,接近所有工作时间的 一半以上。40%7的工作时间都可能会受到大语言模型(LLM)的影响,无论行业。5生成式 AI 时代下的数据战略埃森哲技术展望 2023:当原子遇见比特,埃森哲,2023,https:/ 2023:当

6、原子遇见比特,埃森哲,2023,https:/ 2023 年 2 月首席高管动向调研生成式人工智能:人人可用的新时代,埃森哲,2023,https:/ AI 时代下的数据战略生成式 AI 可被广泛应用于咨询建议、内容创建、运营助手、流程自动化、企业安全等方面:通过提高生产力、提高效率、提升客户体验等方式,预计生成式 AI 将为企业带来 5 亿美元到 30 亿美元不等的价值。8图 1:生成式 AI 的应用场景举例来源:埃森哲研究企业积极探索生成式 AI 应用,机遇与挑战并存生成式 AI 对于各行业企业都有潜在的巨大价值咨询建议内容创建运营助手流程自动化企业安全知识工作顾问用例创意内容生成/共同生

7、成为产品或网站生成创意视觉设计自动化测试财务与会计、采购等领域的业务流程自动化服务管理领域的 IT 流程自动化防止欺诈、完善监管合规主动识别风险内容生成视觉设计应用开发运维服务质量工程业务流程IT 流程信息安全风险治理为行动或决策提供建议领域需求生成/产品定义、代码生成对话助手/客户服务生成式人工智能:人人可用的新时代,埃森哲,2023,https:/ AI 时代下的数据战略同时,日新月异的技术发展也将带来新的挑战要让基础模型在企业中发挥适当作用,就必须了解其最佳应用场景。许多人工智能应用程序使用的数据类型,已超出基础模型的处理范围。同时,基础模型可以尝试的一些应用模式,从根本上说仍更适合狭义

8、的人工智能。快速增长的计算需求,以及处理大规模计算所需的相关成本和专业知识,是当前面临的最大障碍。多方报告显示,大型人工智能模型训练所需的计算量正呈指数级增长,从每 10个月翻一番,加快至每 3、4 个月翻一番。9 模型即使经过训练后,还需通过微调才可处理不同任务,因此所有下游应用的运行和托管成本亦十分高昂。同时,要实现生成式 AI 的潜力,数据也扮演着至关重要的角色。数据不仅是生成式 AI的燃料,更是支撑其模型训练和创新的基石。因此,对于企业而言,未来的数据战略将不仅聚焦于收集和管理数据,更要关注模型的训练方式、内容生成的质量和数据应用的广度。企业需要不断地审视、调整和优化其数据战略,以一个

9、全面的数据战略布局来有效应对生成式AI 时代下的挑战。埃森哲技术展望 2023:当原子遇见比特,埃森哲,2023,https:/ AI 时代,重新审视企业数据战略02生成式 AI 时代下的数据战略89生成式 AI 时代下的数据战略01 找准应用方向,激发创新价值选择一些低风险领域进行可行性评估,然后开展生成式 AI 试点,探索创新的潜力。02准备专有数据,确保数据安全花时间和精力来准备数据基础,且这个数据基础需要在云平台上进行管理,确保数据的安全性和可靠性。03驱动数据管理,打造最佳实践利用高质量的数据,显著提升模型训练与数据应用成效,助力企业高效实现数据管理目标。04重构基础设施,实现高效运

10、营考虑支撑人工智能所需的基础设施、架构、运营模式和治理结构等,同时密切关注成本和可持续能源消耗。面向生成式 AI 应用,企业数据战略需把握四大关键点关键点之一:找准应用方向,激发创新价值应用方向生成式 AI 能够在多方面提供智能化服务,提高企业运营效能提升生产力和创造力:生成式 AI 将成为人们必不可少的创意伙伴,不但可以揭示接触和吸引受众的新方法,还能在生产设计、设计研究、视觉识别、名称拟定、副本生成与测试以及实时个性化等领域中,带来前所未见的速度和创新。生成式 AI 还能助力代码编写、实现代码编写自动化、预测和预先防范问题,以及管理系统文档、获得数据洞察等。面向领域:零售、金融、服务、IT

11、 等行业增强客户体验:大语言模型有望帮助处理约 70%非面对面的客户服务沟通,充分利用强大的对话式智能机器人,理解客户意愿、自行拟定回答,提高答复的准确性和质量。典型领域包括聊天机器人、虚拟助手、智能导购、销售赋能、人力资源、科学研究、企业战略和市场情报等。面向领域:供应链、零售、服务等行业优化业务流程:生成式 AI 对历史背景、下一步最佳行动、总结能力和预测智能的成熟理解力,将同时在前后台办公环境中催生出一个超高效、超个性化的新时代,将业务流程自动化推升到具有变革意义的新水平。此外,在安全防护、内容审核等方面,生成式 AI 将支持企业加强治理和信息安全、防止欺诈、完善监管合规,通过在组织内部

12、和外部均建立跨域联系和推断能力,主动识别风险。面向领域:供应链、零售、金融等行业生成式 AI 时代下的数据战略1011生成式 AI 时代下的数据战略应用实例 某在线旅行代理商通过部署“智能客服”插件,通过为用户提供旅游出行的个性化建议,帮助他们更快确定行程安排。对于意外的行程更改,旅客可以通过全天候在线的智能客服快速解决问题。某饮料零售企业正在使用一个人工智能平台,根据广告在不同平台的适用性进行评级,并提取出实现最大投资回报率(ROI)所需的关键要素,从而创建一套成功广告活动的规则,此举使广告支出回报率显著提高。埃森哲尝试利用大语言模型自动生成文档,提高开发人员在系统配置、功能及技术参数设置方

13、面的工作效率。某跨国银行正在使用生成式 AI 和大语言模型,改变其大量交易后处理电子邮件的管理方式,如自动起草带有行动建议的消息,并发送给收件人。这不只是减少了工作量,还能让客户交流更加顺畅。12对于不同行业而言,生成式 AI 将不同程度地改变其工作方式,企业应找准方向实现突破10图 2:基于 2021 年美国就业水平,按行业和人工智能潜在影响力划分的工时分布来源:埃森哲研究54%48%36%40%43%33%34%31%28%30%30%26%26%26%27%28%25%24%24%20%0%10%20%30%40%50%60%70%80%90%100%12%14%21%14%9%24%1

14、0%12%15%18%34%33%46%38%27%26%41%50%50%50%52%50%54%57%56%64%26%28%29%14%21%12%22%33%35%20%13%16%15%15%17%14%13%11%14%13%7%9%11%9%6%13%8%6%6%6%8%6%6%5%银行更具自动化潜力更具人员强化潜力更具人员强化或自动化的潜力较低非语言任务保险软件和平台资本市场能源通信和媒体零售行业平均值医疗保健公共服务航天与国防汽车高科技旅游公用事业生命科学工业消费品和服务化工自然资源在美国,语言任务占据总工作时长的 62%。在语言任务的总体份额中,65%很可能实现自动化或得到

15、大语言模型的协助。11根据埃森哲研究预测,未来所有行业中,将有40%的工作受到大语言模型的影响。企业应当迅速行动,寻找适合自己的创新机会。生成式人工智能:人人可用的新时代,埃森哲,2023,https:/ 1113生成式 AI 时代下的数据战略来源:埃森哲研究个性化销售策略生成式 AI 可以突出客户相似性和产品采用差异,以创建个性化优惠和推广活动,获得追加销售机会。内容生成为社交媒体帖子和博客创建内容,针对目标客户生成特色视频广告和动画用户故事,提高品牌知名度。品牌监控跟踪品牌的在线提及情况,提醒公司任何负面评论或反馈。在问题升级并损害品牌声誉之前自动响应以解决问题。个性化虚拟客服基于高级情感

16、分析,实现虚拟客户服务代理和跨渠道通信的个性化。消息推送向客户发送有针对性的电子邮件广告/通知。投诉处理自动投诉分类和优先级排序以及跨渠道的建议解决方案。零售银行图 3:生成式 AI 将 360 为企业带来创新应用机会。客户服务行业特定领域人才与组织法律法规采购寻源供应链生产制造新业务商业销售AI数据平台构建数字核心云安全市场可持续性并购研发企业战略IT财务14生成式 AI 时代下的数据战略辅助芯片设计利用 GenAI 改进 EDA(电子设计自动化),帮助应对芯片生命周期管理的复杂性。与代工厂的原型验证流程相连接,快速进行芯片设计原型验证,提高企业市场快速反应能力。金融研究与个性化财富咨询通过

17、委派文档生成功能,使顾问能够专注于增值活动。通过更好地了解客户需求和要求,提供卓越的服务和合适的产品,从而增加市场份额/资产管理规模。赋能代理基于客户互动和索赔的经验,为保险代理人提供定制建议和有关兴趣领域知识,帮助代理人与客户沟通。策略生成生成保险报价、绑定、保单签发文件,并根据投保人的具体需求和偏好向他们提供不同的承保选项。理赔受理改善理赔受理体验的个性化沟通;根据多式联运索赔人输入自动检测严重性;进行快速检查/分析以确定损失原因并自动提取用于确定承保范围的关键术语。代码生成生成式 AI 可用于生成代码和自动化软件开发。它可以接受自然语言输入并将其转换为代码。代码审查生成式 AI 可以查看

18、代码的一致性,编辑代码并提供生产质量代码。它还可以支持识别和修复代码错误。高科技保险软件和平台15生成式 AI 时代下的数据战略以保险行业为例,生成式 AI 可应用于从市场营销到出险理赔的各个阶段。其中具较高投资回报率的场景如:数据增强:客服场景中为承保人员快速生成第三方数据源的信息摘要和见解,以帮助他们做出更准确的判断 理赔核验:出险核验时对多模态数据进行快速检查/分析后,提取关键词并定损产品营销邮件营销依据经纪人的兴趣自动化生成主题和营销活动邮件以覆盖优质经纪人群体智能邮件理解邮件意图然后进行非结构化数据处理、验证和检查“良好订单”。高度定制基于高级情感分析的虚拟客服代理和跨渠道的个性化沟

19、通。无缝理赔受理通过个性化沟通策略来改善理赔申请体验赋能员工通过针对经纪人的兴趣话题、参与历史和理赔经验提供定制化建议和高级洞察力智能提取自动从非结构化的由经纪人提交的信息中提取关键术语,如保单手册,以增强风险评估。通知生成创建具有上下文感知、个性化和自动化的信函/通知生成系统。理赔核验进行快速检查/分析以确定损失原因,并自动提取关键术语以用于理赔决定数字营销自动生成数字营销内容,如博客文章、社交媒体更新、电子邮件通讯和落地页数据增强为承保人员提供快速的第三方数据源输入摘要和见解,以帮助他们做出明智的选择。投诉处理自动化对投诉进行分类、优先级排序,并跨渠道提供解决方案。理赔洞察利用历史数据发现

20、规律和模板,为理赔理算师提供洞察,以使决策更加明智和准确舆论监控追踪品牌在网络上的评价,在负面评价升级并损害品牌声誉之前向保险公司发出警报。智能筛选通过理解总结转介规则并根据风险偏好智能筛选适当的承保人员评估和处理申请健康干预根据客户的特定需求、兴趣和行为定制生成推荐内容,以推动更高的参与度和互动性追偿/诉讼处理通过对数据洞察(如传票信函),预测潜在的和解或法庭结果欺诈检测利用合成数据来解决数据稀缺问题,模拟不同欺诈情景以提高欺诈检测能力改进保险代理人和客户参与度指标、成交率和投资回报率提高风险评估和承销商效率增强客户体验并降低服务成本减少赔偿和费用保单生成自动化保单生成和质量分析/审核,以提

21、高保单的完整性、一致性和合规性客户承保客户服务保险理赔图 4:保险行业价值链中的应用场景16在快消品行业,具备高投资回报率的生成式 AI 创新场景,如:新产品设计研发:使用生成式 AI 快速进行原型设计和验证,加速产品上市 自动化市场营销:依据产品文档和消费趋势数据自动生成营销材料,提升营销效率增长与创新营销、销售和服务关键领域供应链可持续赋能职能增长战略优先级消费者、营销&内容管理自动化消费者服务自动化客户/分销商服务商业智能发现智能数据处理智能协商指导客户、分销商和渠道管理规划采购与供应链排放、资源&道德影响管理自动化 ESG 重要关系 人服务生产制造执行物流智能需求感知智能合约管理自动化

22、 ESG 内容创建&报告投资者活动追踪劳动力规划&人力资本企业规划财务管理影响无非常低低中高非常高IT 管理增强招聘入职&人力资源运营 自动化定制职业培训&职业 道路设计绩效管理优化生成式预测&情景建模自动化企业内容创建&报告自动化 IT 开发&运营智能风险收益投资建议ESG 影响杠杆识别智能预测性资产维护自动化供应商交互和订单管理动态和交互式控制塔教练综合收入增长管理社会风险监测管理虚拟营销活动测试自动化市场营销市场渠道自动化虚拟销售团队 和服务网点全方位优化指导消费者高定和情境化数字内容增长机会研究新产品开发与设计虚拟概念/产品测试投资与自助并购研究敏捷投资组合管理测试与发布商业模式创新图

23、 5:快消品行业价值链中的应用场景来源:埃森哲研究17生成式 AI 时代下的数据战略各行业大量的生成式 AI 创新场景激发出对技术产品和服务的需求,如:利用对话机器人、虚拟个人助手减少客户投诉,精确定位客户需求,优化客户体验 基于生成式 AI 的代码助手极大提升了软件开发的效率和质量,提升员工生产力 利用样式设计助手点燃设计灵感,激活创新思维,生成创意内容 借助文档处理助手,自动化企业文档检索、数据提取等流程,改善业务运营效率智能聊天对话机器人对话式搜索内容写作文档处理AI 智能合同中心代码生成样式设计网络安全生成式 AI 创新场景大量涌现,激发相关技术产品与服务,助力企业价值实现优化客户体验

24、提升员工生产力生成创意内容改善业务运营效率虚拟个人助理信息提取与总结媒体创新流程优化个性化服务定制从数据到洞察建模生成数据增强18亚马逊云科技通过开箱即用的生成式 AI 技术服务,快速激发产品与服务创新 Amazon QuickSight BI 提供了一种更快的方法,帮助用户从数据中直接获取洞察QuickSight 允许用户轻松连接到 S3 或 Athena 等数据源,并在几分钟内创建交互式仪表板,并使用自然语言在数秒内生成洞察结论并微调数据可视化效果。用户可以用简单的语言查询他们的数据,而无需编写一行代码。借助这些新功能,业务用户可以提出“为什么”的问题,以更好地了解影响数据趋势的因素。用户

25、还可以通过说“预测未来 12 个月的销售额”来预测指标,以获得基于过去数据和季节性等信息的即时响应。使用人工智能编码伙伴更快、更安全地构建应用程序Amazon CodeWhisperer 经过数十亿行代码的训练,可以根据您的评论和现有代码实时生成从代码片段到全函数的代码建议。绕过耗时的编码任务,加速使用不熟悉的 API 进行的构建。通过生成式 AI 助手 Amazon Q 全面提升企业的生产力Amazon Q 是亚马逊云科技推出的生成式 AI 助手,可以通过互动对话解决问题、生成内容并采取行动。Amazon Q 能了解您的公司信息、代码和系统,并在保障安全与隐私的基础上,根据您的角色和权限进行

26、个性化交互。Amazon Q 既能作为单独的应用程序,作为您的商务专家,也能集成在亚马逊云科技的控制台、Amazon CodeWhisperer、各类 IDE、Amazon Quicksight 以及 Amazon Connect。基于亚马逊云科技 17 年的知识,能够为您的整个开发流程提供支持。图 6:亚马逊云科技 QuickSight BI 产品的数据洞察图 7:亚马逊云科技 Amazon CodeWhisperer来源:亚马逊云科技、埃森哲研究来源:亚马逊云科技、埃森哲研究来源:亚马逊云科技、埃森哲研究图 8:亚马逊云科技 Amazon Bedrock19生成式 AI 时代下的数据战略A

27、mazon Bedrock 使用基础模型构建和扩展生成式 AI 应用程序的便捷方式 选择 FM直接使用或定制 FM发送提示词接收响应使用 Playground 试用 FM 并选择适合您需求的 FM通过调用无服务的API,运用 FM 来构建生成式 AI 应用Bedrock 将自动部署 FM 进行推理,或则根据需求来进行模型微调使用 Bedrock API 来发送提示词给 FM在您的应用中接收 FM 的响应Amazon BedrockAmazon Bedrock 有以下特点:预训练的基础模型:Amazon Bedrock 提供易于使用的开发者体验,可与来自 AI21 Labs、Anthropic、

28、Cohere、Meta、Stability AI 和 Amazon 等领先人工智能公司的各种高性能 FM 合作。自定义和微调能力:可通过可视化界面使用私有数据对模型进行自定义和微调。使用微调和检索增强生成(RAG)等技术利用私有数据对其进行定制,并创建可执行复杂业务任务。扩展性和可伸缩性:Amazon Bedrock 是无服务器的,无需管理任何基础设施,能够随着项目的增长而扩展,支持大规模的应用开发。安全和合规:Amazon Bedrock 提供了多种支持安全和隐私要求的功能,已获得 HIPAA 资格并符合 GDPR 合规性。01020304关键点之二:准备专有数据,确保数据安全在使用基础模型

29、之前,企业需要花时间和精力来准备数据基础,且这个数据基础需要在云平台上进行管理,确保数据的安全性和可靠性20数据准备现阶段,大多数企业会直接购买“模型即服务”来开展业务应用。不过对许多企业来说,最大的价值或将源于使用自身的数据定制或微调(Fine-tune)模型,满足其独特需求。为了提高生成式 AI 和基础模型在特定业务应用方式中的价值,企业将越来越多地利用自身数据对预训练模型加以微调来实现定制,从而让绩效实现质的飞跃。在工具层面,亚马逊云科技的 Amazon Bedrock 和 Amazon SageMaker Jumpstart,分别面向基础模型有着不同需求的客户提供微调的路径。在 Ama

30、zon Bedrock 中,客户只需调用模型 API,也可以对基础模型进行微调,而无需管理模型配置或部署;而在 Amazon Sagemaker 中,客户需要管理应用程序架构中的模型部署、配置和托管,将会有更大的灵活度和自由度对基础模型进行定制。数据安全随着时间推移,生成式 AI 将支持企业加强治理和信息安全、防止欺诈、完善监管合规,并通过在组织内部和外部均建立跨域联系和推断能力,主动识别风险。在战略性网络防御体系中,大语言模型可以提供多种有用的功能,例如解释恶意软件和快速分类网站。但在短期内,企业很可能看到,黑客利用生成式 AI 的特长来生成恶意代码或编写完美的网络钓鱼电子邮件。生成式 AI

31、 时代下的数据战略21生成式 AI 时代下的数据战略企业需要采用一种战略性、规范化的方法,获取、开发、提炼、保护和部署数据。应依托云环境构建现代化的企业数据平台,其中包含一组可信赖、可重复使用的数据产品。凭借此类平台的跨职能特征、企业级的分析工具,以及将数据存储在云端仓库或数据湖当中,数据能够摆脱组织孤岛的束缚,在整个企业中普遍使用。随后,企业可以在某一地点或通过分布式计算策略(如数据网格),统一分析所有业务数据。基础模型需要大量精心组织的数据来学习,因此,破解数据挑战已成为每家企业的当务之急图 9:数据准备过程来源:埃森哲研究需要的数据类型评估数据的可用性数据的真实性环境准备明确数据要求数据

32、质量评估数据的完整性定制模型数据合规要求应用价值确认各类数据源数据量与存储方式定义数据基础评估数据的安全要求和隐私分类数据应用评估数据可用性22生成式 AI 时代下的数据风险同样需要引起重视越来越多的企业已开始积极探索相关应用,以期提升创新效率、实现高质增长。然而生成式 AI 应用的风险贯穿于模型设计、搭建、使用各个阶段,并会产生长远的效应。比如,生成式 AI 基于学习需要而对用户数据的留存、分析是否侵犯了个人和商业隐私,以及相关数据保护法案;生成式 AI 的运作核心是机器学习,其价值与数据的质量和真实性密切相关,如果一台基础模型长期浸染在存有偏差的数据当中,它就会被这些数据“诱导”,从而输出

33、错误的信息或执行歧视性操作;另一方面,某些群体特质也会使生成式 AI 为其打上固化标签,“一刀切”地去执行某些程序,而失去了应有的公平性。01 02 03 23生成式 AI 时代下的数据战略数据安全是构建生成式 AI 能力的关键实施安全密钥管理Amazon KMS:静态数据保护自动化Amazon config,Amazon Security hub:实施访问控制Amazon IAM,Amazon S3 Versioning:利用机制限制数据访问Amazon System Manager,Amazon CloudTrail:保护使用中的数据 身份认证 隔离环境 多方协作 数据共享保护传输中的数据

34、 跨区域之间的传输 VPC 内部以及 VPC 之间的传输 迁移上云的过程中 TLS 1.2+AES 256 保护存储中的数据24Amazon Bedrock 确保生成式 AI 应用过程中的数据隐私和安全Amazon Bedrock 让您始终掌控私域数据 客户数据不会用于改进 Amazon Titan 模型,也不会与其他的基础模型提供商共享 客户的数据(包括提示词、生成的内容、微调后的模型)均会保存在创建它们的区域 支持亚马逊云科技 PrivateLink,以便您使用 VPC 端点在虚拟私有云(VPC)和 Amazon Bedrock 服务之间建立私有连接 客户数据在传输过程中始终使用 TLS1

35、.2 进行加密,静态数据始终使用服务托管密钥进行加密 与 亚马逊云科技 身份和访问管理服务(IAM)集成,以管理推理访问、拒绝特定模型的访问并启用控制台访问 在与应用程序集成时,您可以使用 Amazon CloudTrail 监控 API 活动并解决问题 微调(自定义)模型使用客户 KMS/CMK 密钥进行加密和存储。或者只有您可以访问您的自定义模型 在微调任务中支持 VPC 的设置关键点之三:驱动数据管理,打造最佳实践生成式 AI 帮助自动化数据管理手动流程,并确保所生成输出的准确性。将智能嵌入数据治理将提高数据使用者的整体生产力结构化 源数据/系统分析 代码开发/测试 代码管理 元数据管理

36、 数据治理工具 数据管理组织、制 度、流程 数据安全合规 数据质量 数据资产目录 数据标准 数据生命周期管理 主数据管理 人工智能-访问管理 查询开发 丰富数据目录 数据隐私保护非结构化批处理MFT实时准实时第三方数据集成内部系统外部系统非结构化信息AL/ML 建模数据报告自助服务数据源生成式用例生成式用例生成式用例数据数据治理与管理数据消费数据集成图 10:生成式 AI 在数据管理流程中的应用来源:埃森哲研究25生成式 AI 时代下的数据战略26通过生成式 AI 驱动数据管理,能够:优化分析和洞察,为数据驱动型决策提供支持 通过数据民主化、协作和素养实现业务运营 通过一致性在整个组织内实现适

37、合用途的数据使用情况 支持数据隐私工作,以实现消费者隐私和法规遵从性生成式 AI 将在多方面赋能数据管理工作,助力企业实现数据管理目标主动元数据管理通过使用算法训练与业务文档和元数据相匹配,加速数据目录的开发,提高数据的查找和解释能力。数据质量可信识别、总结和纠正数据质量问题。主数据管理创建数据质量规则,帮助标准化和合并记录,并优化匹配规则以创建“黄金记录”。运营模型基于角色的活动识别和支持数据所有者和数据监管者,并定义数据治理角色和责任。政策与工作流程提供数据治理最佳实践建议,帮助起草和解释与政策相关的内容,并优化数据工作流程。变革管理创建通信内容,减少内容创建时间,部署聊天机器人以提供帮助

38、,优化利益相关者、培训和需求管理。数据隐私与保护基于监管要求、国家法规的指导,提出政策建议,数据访问控制和限制程序,确保数据安全和数据分类合规。数据生命周期管理部署数据创建、存储和备份技术以支持数据生命周期管理,制定存档策略,并主动识别需要存档或处置的数据。工具增强提升数据治理工具的搜索功能,与企业资产进行连接,并分析工具间的差距。27生成式 AI 时代下的数据战略图 11:生成式 AI 数据管理应用最佳实践来源:埃森哲研究生成式人工智能通过“业务文档”查找和编译常见术语和定义,以添加到数据目录中。快速、高效地提供行业特定的术语。缩短处理时间,减少错误,提高效率并实现成本节约。更高的数据记录掌

39、握准确率,从而实现更准确的营销目标定位。有效地减少未来发生安全漏洞的可能性。纠正并提高数据的适用性和质量。减少数据监管内容创建时间,通过虚拟培训实现成本节约。数据监管者识别有助于确立数据所有权。减少由于不良协议导致的重要数据灾难性丧失的风险。通过消除与冗余存储设备相关的维护成本,实现成本节约。改善数据治理资产的整合程度。数据目录内容创建数据质量问题唯一标识符识别数据监管者识别工作流程自动化数据监管内容创建安全协议分析数据存储实践企业资产互操作性生成式人工智能通过客户情感反馈或帮助台日志查找和总结数据质量问题的示例。公司将客户数据存储在多个系统中,难以识别唯一标识符以合并客户记录。生成式人工智能

40、模型在所有系统中训练客户数据,以识别最佳指标以掌握客户记录。将生成式人工智能工具集成到数据管理系统中,以分析基于角色的活动,从而识别数据所有者和数据监管者。数据监管者使用生成式人工智能从政策文件中提取结构化和非结构化数据,用于自动化工作流程。数据管家使用生成式人工智能创建数据监督管理培训议程和材料,并进行培训。生成式人工智能工具获得了公司的数据存储和备份协议的访问权限,分析了现有技术并发现了一些改进的方面,例如冗余存储设备和不频繁的备份。然后编制了一份改进存储实践的建议清单。IT 部门将生成式人工智能集成到其数据治理工具中,并继续优化生成式人工智能的训练数据以提高性能。一家公司最近遭受了安全漏

41、洞,并决心防止再次发生。生成式人工智能获得了公司现有安全协议的访问权限,以分析可能被利用的弱点,并提供解决这些弱点的建议清单。主动元数据管理场景举例应用结果数据可信主数据管理运营模型政策与工作流程变革管理数据隐私与保护数据生命周期管理工具增强28图 12:贯穿生成式 AI 全周期的数据治理来源:亚马逊云科技,埃森哲整理存储&查询Amazon Lake Formation编目治理Amazon DataZone行用&应用DATA SOURCESFOR APPLICATIONSFOR ANALYTICS&MLData WarehouseMACHINE LEARNINGData LakeGENERAT

42、IVE AIBig DataBUSINESS INTELLIGENCEAmazon RedshiftAmazon SageMakerAmazon S3Amazon BedrockAmazon EMRAmazon QuickSightPEOPLEAPPSDEVICESAmazon AuroraAmazon DynamoDBAmazon KinesisAmazon MSKIOT/DEVICESAPP/LOGS3RD PARTY DATA亚马逊云科技提供了贯穿生成式 AI 全周期的数据治理,从数据源的获取到数据的存储和查询,再到将数据传输给 AI 平台进行模型的训练、调优和推理,以及全面实施数据分类

43、和治理。通过提供一整套的解决方案、产品服务和实践,全面保护存储中、传输中以及使用中的数据。Amazon Lake Formation 服务支持统一的数据使用、保护、共享、审计和治理,用于一站式构建、管理和监控安全可靠的数据湖。29生成式 AI 时代下的数据战略图 13:通过 Amazon Lake Formation 简化安全管理来源:亚马逊云科技、埃森哲研究Data lake adminData lakeAmazon RedshiftLake FormationAmazonEMRAccess controlAmazonAthenaAWS Glue Data CatalogAmazon Ope

44、nSearch 服务、Amazon Aurora PostgreSQL 和 Amazon RDS for PostgreSQL 提供向量数据库功能。客户可以使用这些功能来存储和搜索其机器翻译和生成式 AI 应用中使用的嵌入。实现将向量与数据同地放置,可以更轻松地连接数据并减少数据重复。应用 Amazon OpenSearch Serverless,客户也无需担心单独数据库的维护、版本控制和许可问题。能力提升:利用云的弹性及时响应对数据处理的需求,提供强大处理能力及无限扩展性 摆脱传统平台束缚,更容易打破数据孤岛,重塑数据架构 自动化的数据集成,零代码、高可用 自助式的数据访问服务,随时满足业务

45、人员的数据获取需求 标准化的机器学习,使业务分析师更易掌握和使用,实现快速赋能成本降低:降低数据中心建设投入成本 降低数据库迁移成本及运维费用 降低数据分析平台构建、使用及维护费用 降低 ETL 成本 节省数据安全费用关键点之四:重构基础设施,实现高效运营为了充分利用大语言模型和生成式 AI,企业应认真考虑所需的数据基础设施和运营模式,同时密切关注成本和可持续能源消耗面向生成式 AI 时代,企业大数据平台面临的实际问题数据驱动的大数据平台智慧运营 解决方案数据成本急剧上升“用数据看数据”“用数据管数据”识别高价值的数据资产实现高效率的资源分配成本管理意识缺失节能减排需求迫切冗余资源治理困难生成

46、式 AI 时代下的数据战略3031生成式 AI 时代下的数据战略亚马逊云科技为生成式 AI 大模型训练提供高性能计算基础架构 GPUAmazon EC2 P4d/P4de 实例由 NVIDIA H100 Tensor Core GPU 提供动力与上一代基于GPU的实例相比,速度快6倍,训练成本节省 40%Amazon EC2 P4d/P4de 实例由 NVIDIA A100 Tensor Core GPU 提供动力与上一代P3/P3dn实例相比,速度提高2.5倍,训练成本降低 60%。Amazon EC2 G5 实例由 NVIDIA A10G Tensor Core GPU 提供动力与上一代

47、G4dn 实例相比,性能提高 3.3 倍32专为生成式 AI 而构建的加速器检索增强生成(RAG)需要向量数据库的支持Amazon Trainium 与 Amazon EC2 实例相比,训练成本可节省高达50%Amazon Trainium 与 Amazon EC2 实例相比,具有高达40%的价格性能优势检索增强生成(Retrieval-Augmented Generation,RAG)需要向量数据库的支持,因为它依赖于有效地检索和处理大量的数据点。在 RAG 中,生成式模型(如文本或语音生成模型)与信息检索系统相结合,以提高输出的相关性和准确性。企业构建的向量数据库需要满足:高效的数据检索:

48、能够存储数十亿个向量嵌入,并能够快速实现向量搜索 可扩展性和高可用性:应对大量查询和数据更新 易于管理和配置:需要配置、管理和扩展集群 技能储备:企业人员需要专门的资源或专业知识因此,对于实现高效的检索增强生成系统,选择合适的向量数据库是一个关键的考量因素,它直接影响了系统的性能、准确性和可靠性。Amazon Bedrock Knowledge Base 原生支持检索增强生成 RAG,能够自动将文本文档转换为嵌入内容,将嵌入存储在向量数据库中,检索嵌入并增强提示。Amazon Bedrock Knowledge Base 支持多种向量数据库,包括 Amazon OpenSearch Serve

49、rless 向量引擎,Redis Enterprise Cloud 以及 Pinecone 等。AMAZON OPENSEARCH SERVICEAMAZON AURORA POSTGRESQLAMAZON RDS FOR POSTGRESQL33生成式 AI 时代下的数据战略重新定义生成式 AI 时代的基础设施Amazon SageMaker 是通过完全托管的基础设施、工具和工作流程为任何用例构建、训练和部署机器学习模型。面向生成式 AI 的应用开发及数据管理,Amazon SageMaker HyperPod能够将训练基础模型的时间缩短高达 40%,能够简化大型训练集群的分布式训练,消除干

50、扰的弹性训练环境,并对集群计算、内存和网络资源实现优化利用。Amazon SageMaker Inference Optimization 基础模型部署成本平均降低高达 50%,延迟平均降低 20%。Amazon SageMaker JumpStart:轻松访问机器学习资产,并快速将机器学习应用程序推向市场适用于 SageMaker 的机器学习中心,浏览约 400 个内容,包括带有预先训练模型的内置算法、(新增)基础模型、解决方案模板和 Notebook 脚本示例在组织内共享和协作与组织内部其他人共享模型和笔记本电脑,并允许他们使用自己的数据进行训练,或按原样部署,便于推理带有示例的 Note

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服