AIGC产业发展和法律合规实务手册.pdf

资源描述

1、AIGC 产业发展与法律合规实务手册 W&W 国际法律团队 V2.0 未经授权，不得转载 5 前言随着人工智能技术的快速发展，人工智能伦理和法律框架的建立变得愈发重要。AI 技术的广泛应用已经超越了传统的信息技术和自动化工具，涵盖了金融、医疗、教育、交通、社交媒体等众多领域。随之而来的是人工智能所面临的伦理和法律风险的挑战。在不同国家和地区，对于人工智能的监管和治理也存在着差异和不确定性。自 2023 年 6 月 W&W 国际法律团队发布AIGC 产业发展与法律合规实务手册 V1.0以来，我们注意到越来越多的国家和地区意识到人工智能的快速发展所带来的伦理和法律挑战，并采取行动制定相关的规定和

2、措施。我们不断关注和研究 AIGC 的发展和实践，了解全球范围内与 AIGC 相关的法律法规，制定并完善企业和组织的 AIGC 合规计划，及时跟进和应对相关的法律风险和挑战，V1.0 版本旨在帮助读者对 AIGC 的法律风险和合规要点有一个初步认识，V2.0 版本则对 AIGC 的背景、技术、行业应用场景、知识产权风险、其他合规要点等进行了一系列的更新，并配备了图示、图例等可视化展示，进行了一次全面更新和扩充，我们希望 V2.0 版本能够满足阅读过 V1.0 版本的读者、初学者和业内同仁了解 AIGC 领域更详细信息的需求。诚然，我们已先后发布两版 AIGC 产业发展与法律合规实务手册，但是我

3、们深知 AIGC是一个不断演进的领域，随着技术日新月异的进步，AIGC 所涉及的法律风险问题也在不断发展和演变，我们深信法律合规是 AIGC 领域可持续发展的基石，W&W 国际法律团队将继续关注 AIGC 的发展动态和趋势，继续输出更多深入版本的内容，期望为能为读者提供更有价值的信息和指导。王捷律师团队|AIGC 合规未经授权，不得转载 6 目录一、一、背景背景.9（一）AIGC 的概念.9（二）数字内容创作的发展阶段.10（三）AIGC 的发展历程.11 1.AIGC 发展的基础条件：互联网形态演化.11 2.AIGC 发展的技术条件：AI 技术的变革.11 3.我国 AI 技术与 AI

4、GC 产业发展状况.13（四）AIGC 模态划分.14（五）AIGC 与元宇宙的联系.15 二、二、技术技术.17（一）训练.17（二）生成.17 三、三、行业应用场景行业应用场景.18（一）传媒.18（二）电商.19（三）影视.19（四）金融.20（五）教育.21（六）医疗.21（七）其他.21 四、四、典型产品典型产品.23（一）ChatGPT.23（二）GitHub Copilot.24（三）Stable Diffusion.24 五、五、商业模式商业模式.26 六、六、知识产权侵权风险与保护知识产权侵权风险与保护路径路径.28（一）知识产权侵权风险.28 王捷律师团队|AIGC 合规

5、未经授权，不得转载 7 1.数据采集和训练阶段.28 2.用户输入阶段.31 3.内容输出阶段.32（二）AIGC 的知识产权保护路径.34 1.可版权性.34 2.版权权利归属.38 七、七、非知识产权领域的合规要求非知识产权领域的合规要求.40（一）概念.40（二）角色分配.40（三）内部管控.41 1.训练数据.41 2.数据标注.44 3.内容审核.45 4.内容标识.47 5.实名认证.49 6.防沉迷.49（四）外部监管.50 1.分级分类管理.50 2.算法备案.50 3.安全评估.51 4.投诉、举报机制.52 5.处罚.52（五）数据流转.53（六）处置措施.54（七）网络安

6、全.55（八）不正当竞争.55（九）个人信息保护.55 八、八、欧盟欧盟Artificial Intelligence Act 解读解读.57（一）关键定义.57 1.人工智能系统.57 王捷律师团队|AIGC 合规未经授权，不得转载 8 2.基础模型和通用人工智能.58（二）风险划分.58 1.具有不可接受风险的人工智能.59 2.最小风险的人工智能.60 3.有限风险的人工智能.60 4.高风险的人工智能.60（三）所有人工智能系统适用的通用原则.61（四）高风险人工智能系统的监管要求.62 1.数据与数据治理.63 2.记录保存.63 3.人类监管.64 4.透明度和向用户提供信息.6

7、4 5.制作和保存技术文档.65 6.不同角色的不同义务.65 7.监管沙盒.68 附录一附录一全球执法案例全球执法案例.71 附录二附录二法规汇总法规汇总.76（一）中国.76 1.互联网信息服务算法推荐管理规定.76 2.具有舆论属性或社会动员能力的互联网信息服务安全评估规定.80 3.互联网信息服务深度合成管理规定.83 4.生成式人工智能服务管理暂行办法.87（二）海外.91 1.欧盟及成员国.91 2.英国.91 3.美国.92 4.新西兰.92 垦丁垦丁W&W国际法律团队简介国际法律团队简介.93 王捷律师团队|AIGC 合规未经授权，不得转载 9 一、一、背景背景（一）（一

8、）AIGC的概念的概念 AIGC 全称为 Artificial Intelligence Generated Content，直译为人工智能生成内容，这些内容包括文本、图像、视频、音频等。目前对于 AIGC 的界定尚无统一规范的定义，2022 年9 月，中国信通院和京东探索研究院共同发布了人工智能生成内容（AIGC）白皮书，将AIGC 定义为“既是从内容生产者视角进行分类的一类内容，又是一种内容生产方式，同时还是用于内容自动化生成的一类技术集合”1。该定义认为 AIGC 兼有内容特征和技术特征两个方面，总体上可以将 AIGC 概括为伴随 AI 技术变革和数字化而产生的一种新的生成式网络信息内容

9、。相比 AIGC，国外用得更多的是 Generative Artificial Intelligence(AI)（直译“生成式人工智能”），偏重技术特征，指可以根据输入或提示从大量数据中学习和模仿，创建文本、图像、音乐、视频、代码等内容的一种人工智能2。图 1 图片来源：艾瑞咨询 2023 年中国 AIGC 产业全景报告 1 京东探索研究院：人工智能生成内容（AIGC）白皮书。2 Harvard University Information Technology,Generative Artificial Intelligence(AI),https:/huit.harvard.edu/ai.

10、王捷律师团队|AIGC 合规未经授权，不得转载 10（二）（二）数字内容创作的发展阶段数字内容创作的发展阶段 1.在 PGC（Professionally-generated Content）模式中，内容由专业团队生成，PGC 的优势在于生成的内容大多质量较高，但生产周期较长，AI 能力弱，难以满足产出的数量要求。2.在 UGC（User Generated Content）模式中，用户可以选择多种创作工具来自己完成内容生成，UGC 的优势在于使用这些创作工具可以降低创作的门槛和成本，提高用户参与的积极性，同时借助的辅助工具具有一定的 AI 能力。但 UGC 因为创作者水平参差不齐，输出的内

11、容质量难以保证。3.PUGC（Professional&User Generated Content）是指专业媒体与用户联合生产的内容生产模式。PUGC 的优势在于参与用户多，内容数量大，AI 能力较强，但仍缺乏专业性以及优质内容的产出。4.AIGC 作为区块链技术和人工智能突破性发展下的内容生成模式，AI 能力极强，可以在数量和质量上克服 PGC 与 UGC 的缺点，其使用专业技术来提高内容生成的质量，极大地提高了效率，但该模式下对人工智能的依赖可能会限制内容的创造性，导致生成的内容缺乏真实性或个性。图 2 图片来源：腾讯研究院 AIGC 发展趋势报告 2023 王捷律师团队|AIGC 合规

12、未经授权，不得转载 11（三）（三）AIGC的发展历程的发展历程 AIGC 是互联网、大数据、人工智能等信息技术综合发展的产物，理解 AIGC 的发展需要回顾互联网和 AI 演进的阶段与特征3。1.AIGC发展的基础条件：互联网形态演化发展的基础条件：互联网形态演化 AIGC 的发展伴随着互联网的形态演进。第一代互联网（Web 1.0）以个人电脑、信息门户和文件传输协议为典型场景，此时内容生产以 PGC 为主，依赖键盘、鼠标、手写画板等传统计算机输入设备，Web1.0 具有门户高度中心化的特点。第二代互联网（Web2.0）以移动互联网、社交媒体和平台经济为典型场景，此时内容生产以 UGC 为

13、主，各类 APP 深入人们的生活生产方式，触控操作、隔空手势识别、语音控制成为主流，Web2.0 具有平台中心化和大众参与的特点，催生了大数据管理和应用体系的诞生。第三代互联网目前被称为Web3.0 或元宇宙，是以区块链技术为基础的人工智能、虚实结合、全真全息的互联网形态。Web3.0 延续了 Web2.0 信息资源的特点，同时具有 AI 自动化、智慧化内容生成特征，驱动了 AIGC 的产生。2.AIGC发展的技术条件：发展的技术条件：AI技术的变革技术的变革结合 AI 的演进，AIGC 的发展历程大致可分为三个阶段：l 早期萌芽阶段（1950s-1990s）1957 年，莱杰伦希勒（Lei

14、aren Hiller）和伦纳德艾萨克森（Leonard Isaacson）通过将计算机程序中的控制变量换成音符完成了历史上第一支由计算机创作的音乐作品可以看作是 AIGC 的开端。1966 年，约瑟夫魏岑鲍姆（Joseph Weizenbaum）和肯尼斯科尔比（Kenneth Colby）共同开发了世界第一款可人机对话的机器人。l 沉淀积累阶段（1990s-2010s）2006 年，深度学习算法取得重大突破，同时期互联网的广泛应用为 AI 算法提供了海量的训练数据；2007 年，出现世界上第一部完全由人工智能创作的小说1 The Road；2012 年，Microsoft 展示基于深层神经网

15、络的全自动同声传译系统4。3 李白杨、白云、詹希旎、李纲：人工智能生成内容（AIGC）的技术特征与形态演进，载图书情报知识2023 年第 40 卷第 1 期，第 66 页至第 74 页。4 京东探索研究院：人工智能生成内容（AIGC）白皮书。王捷律师团队|AIGC 合规未经授权，不得转载 12 l 快速发展阶段（2010s-2022 年）AIGC 自 2014 年生成式对抗网络（Generative Adversarial Network，GAN）提出后迎来了发展的新阶段，GAN 成为早期最为著名的生成模型，被广泛用于生成图像、视频、语音和三维物体模型等；随着 2018 年谷歌发布基于 Tr

16、ansformer 机器学习方法的自然语言处理预训练模型 BERT，该预训练模型的出现引发了 AIGC 技术能力的变革。l 大规模应用阶段（2022 年-至今）2022 年 AIGC 迎来了大爆发，Open AI 的大型语言生成模型 ChatGPT 推出仅两个月后，活性用户数量突破一亿。2022 年之后，各方面因素为 AIGC 迎来更快发展创造了有利条件，首先是新的技术如扩散模型，缩减了训练和运行推理所需的成本。与此同时，研究学界也在持续开发更好的算法与规模更大的模型。而开发者的权限也有了变化，从封闭测试版扩大到开放测试版，甚至有些模型还开放了源代码供开发人员调用。对于那些一直渴望使用大型语言

17、模型的开发人员来说，探索和应用开发的大门已经打开，基于这些技术的应用开始大量涌现5。AIGC 技术逐步渗透至生活场景的各个角落，智能家居、智慧交通、智慧医疗、智慧教育、智能零售、虚拟社交等越来越多的行业领域可以看见 AIGC 赋能的场景。如下图所示。图 3 数智融合环境下 AIGC 的应用场景探析6 5 红杉资本：生成式 AI：充满创造力的新世界。6 詹希旎、李白杨、杨建军：数智融合环境下 AIGC 的场景化应用与发展机遇。王捷律师团队|AIGC 合规未经授权，不得转载 13 3.我国我国AI技术与技术与AIGC产业发展状况产业发展状况人工智能的迅速发展将深刻改变人类社会生活、改变世界。为

18、抢抓人工智能发展的重大战略机遇，构筑我国人工智能发展的先发优势，加快建设创新型国家和世界科技强国，2017年国务院发布了新一代人工智能发展规划。我国发展人工智能具有良好基础。国家部署了智能制造等国家重点研发计划重点专项，印发实施了“互联网+”人工智能三年行动实施方案，从科技研发、应用推广和产业发展等方面提出了一系列措施。经过多年的持续积累，我国在人工智能领域取得重要进展，国际科技论文发表量和发明专利授权量已居世界第二，部分领域核心关键技术实现重要突破。语音识别、视觉识别技术世界领先，自适应自主学习、直觉感知、综合推理、混合智能和群体智能等初步具备跨越发展的能力，中文信息处理、智能监控、生物特征

19、识别、工业机器人、服务机器人、无人驾驶逐步进入实际应用，人工智能创新创业日益活跃，一批龙头骨干企业加速成长，在国际上获得广泛关注和认可。加速积累的技术能力与海量的数据资源、巨大的应用需求、开放的市场环境有机结合，形成了我国人工智能发展的独特优势。根据 2017 年国务院发布的新一代人工发展规划，我国人工智能整体发展水平与发达国家相比仍存在差距，缺少重大原创成果，在基础理论、核心算法以及关键设备、高端芯片、重大产品与系统、基础材料、元器件、软件与接口等方面差距较大；科研机构和企业尚未形成具有国际影响力的生态圈和产业链，缺乏系统的超前研发布局；人工智能尖端人才远远不能满足需求；适应人工智能发展的基

20、础设施、政策法规、标准体系亟待完善。7 从投融资情况看，我国 AIGC 产业展现出高热度和高成长性。2021 年至 2023 年7 月期间我国 AIGC 赛道共发生 280 笔投融资，从产业细分维度，应用层创业机会最多，模型层创业受到 ChatGPT 影响在 2023 年集中涌现。8目前国内 AIGC 模型有清华大学的 ChatGLM，百度的文心一言，阿里巴巴的通义千问，腾讯的混元 AI 大模型，华为的盘古大模型，360 的 360 智脑，抖音的云雀大模型等。7 国务院：新一代人工智能发展规划。8 艾瑞咨询：2023 年中国 AIGC 产业全景报告。userid:497168,docid:15

21、0041,date:2023-12-28, 王捷律师团队|AIGC 合规未经授权，不得转载 14 图 4 图片来源：艾瑞咨询 2023 年中国 AIGC 产业全景报告（四）（四）AIGC模态划分模态划分9 从生成内容层面来看，AIGC 可分为以下几个模态：l 文本生成。AIGC 把结构写作、创造性写作和对话写作作为其主要分支。结构化写作主要基于特定场景的结构化数据来生成文本内容，如新闻；创造性写作适合开放性程度更高的内容，如营销文案、社交媒体和社交应用；对话写作主要用于通过文本与用户交互的聊天机器人，这些机器人旨在回答问题。JasperAI，ChatGPT 等属于此类模型。l 图片生成。通过

22、利用 AIGC，用户可以根据给定提示在他们的图片中更改或添加新元素；AIGC 也可以独立生成图像，以满足特定要求，以及从 2D 图像中创建三维模型。图片生成根据使用场景可分为图像编辑修改与图像自主生成，图像编辑修改应用于图像修复、人脸替换、图像水印去除、图像背景去除等等，而图像自主生成 9 Chaoning Zhang and Chenshuang Zhang and Sheng Zheng and Yu Qiao and Chenghao Li and Mengchun Zhang and Sumit Kumar Dam and Chu Myaet Thwal and Ye Lin Tun

23、and Le Luang Huy and Donguk kim and Sung-Ho Bae and Lik-Hang Lee and Yang Yang and Heng Tao Shen and In So Kweon and Choong Seon Hong,A Complete Survey on Generative AI(AIGC):Is ChatGPT from GPT-4 to GPT-5 All You Need?,https:/arxiv.org/abs/2303.11717.王捷律师团队|AIGC 合规未经授权，不得转载 15 包括真实图像生成卡通图像、参照图像生成绘

24、画图像、真实图像生成素描图像等。主要以 EditGAN，DALL-E 等模型为代表。l 音频生成。AIGC 的音频生成技术可以分为两类：第一类为文本到语音合成，即输入文本后可以输出特定者的语音，主要用于机器人和语音广播；第二类语音克隆是指给特定目标输入语音，该语音会转换成特定目标输出的语音，通常用于智能配音和其他类似场景，以合成来自特定目标的语音。此外，可基于文本描述或图片内容理解生成场景化音频、乐曲等。DeepMusic、Deep Voice 等模型属于此类。l 视频生成。AIGC 用于视频生成与图像生成原理类似，主要分为视频编辑与视频自主生成。视频编辑已被用于视频剪辑处理，以生成预告片和宣

25、传视频，利用人工智能算法来检测视频剪辑的流程，并在视频修复、视频超分等方面开展应用。视频自主生成主要应用于图像生成视频、文本生成视频两方面。代表性模型有VideoGPT，Imagen video 等。表格 1 多模态 AIGC 产品实例10 （五）（五）AIGC与元宇宙的联系与元宇宙的联系元宇宙是一个虚拟世界，采用虚拟现实技术创造逼真的视觉和听觉体验，从而可以用来模拟现实世界的情景，并实现用户以虚拟形式进行互动。元宇宙是互联网发展的新阶段，在内容生产方面，AIGC 可用于服务元宇宙的内容生成，例如虚拟地图、虚拟物品、虚拟角色和虚拟场景等，从而创建更加逼真的元宇宙体验。在这一点上，AIGC 可

26、以克服传统数字内容制作开发周期长的缺点，可根据已有数据做衍生，更加高效地为元宇宙发展创作数字内容。10 向安玲：赋能与负能：AIGC 的技术红利与风险规制。王捷律师团队|AIGC 合规未经授权，不得转载 16 AIGC 能够以更少的成本、更快的速度，生成更具个性化的数字场景与内容，会大大提高元宇宙数字内容的制作效能，极大地扩展元宇宙商业前景。同样的，大量用户在元宇宙中的体验和反馈，也为 AIGC 技术的细分发展与优化提高提供海量数据支撑，从而让 AIGC 技术不断迭代更新。有学者指出，实现去中心化的 AI 内容生产与元宇宙的技术架构有机融合能够对生成的海量内容和数据进行聚合与管理，创建共建共

27、享的新型经济激励系统，催生新的适应元宇宙发展要求的内容生产范式，AIGC 与元宇宙是可以实现互相成就的11。11 郭全中、袁柏林：AIGC 与 WEB3.0 有机融合:元宇宙内容生产的新范式，载南方传媒研究2023年第 1 期，第 36-47 页。王捷律师团队|AIGC 合规未经授权，不得转载 17 二、二、技术技术截止至 2023 年 10 月，基于 Google 于 2017 年发布的 Transformer 技术而开发的各种大语言模型（Large Language Model，以下或简称为“大模型”）已经百花齐放。大模型中的“大”，可分为两个层面，一是模型参数量大，二是训练数据量大。

28、模型参数量大和训练数据量大这两个条件的同时满足，是大模型能够在各种领域生成特定输出结果的关键。下文以训练和生成两个方面，简述大模型训练的基本原理和其在生成内容时的固有问题，为后续大模型的合规风险阐述予以铺垫。（一）（一）训练训练以“文本生成文本”（以下简称“文生文”）领域的大模型为例，模型的训练数据，可大致分为 3 步（但并非每个文生文模型均经过这 3 步训练）。第一步是使用海量的文本数据进行无监督学习（未使用标注后的数据），经过该步训练的文生文大模型一般会具备一定的通用能力。第二步是使用特定领域（如金融）或特定场景（如聊天）的数据，经过该步训练后，文生文大模型将具备一定特定领域的文本生成能

29、力，以法律领域为例，可回答一些基本的民法、刑法问题。第三步训练则加入了人类的评价和反馈数据，人类将在由文生文大模型生成的多个输出结果中选择其一，引导大模型输出更符合人类希望获得的输出结果。文生文大模型的训练数据仅为文本，而以一种模态为输入、另一种模态为输出的大模型，其训练数据则为两种模态内容的一一对应。以“文本生成图片”（以下简称“文生图”）领域的大模型为例，其训练数据为海量的“文本与图片对应”，即一幅图片对应一段文字的描述。（二）（二）生成生成因大模型本身“基于概率生成”的特性，即使是同样的输入内容，仍然会生成不同的输出结果，且模型训练者无法直接控制大模型生成的内容；同时，大模型本身并不理

30、解输入内容，其仅是根据输入内容、模式、规则等生成看似“合理”的输出结果，但无法保证输出结果符合事实，这使得大语言模型会生成语法/模式/规则方面正确但与事实不符的输出。王捷律师团队|AIGC 合规未经授权，不得转载 18 三、三、行业应用场景行业应用场景由于 AIGC 涉及的行业和应用场景繁多，我们无法穷尽所有涉及 AIGC 的行业及应用场景，以下仅就部分典型行业应用场景进行介绍和分析。（一）（一）传媒传媒在传媒领域，AIGC 作为一种新兴技术，不仅可以在文本层面生成内容，还可以生成图片、视频等多种形式的内容。在文本方面，早在 2022 年，OpenAI 推出了 GPT-3 的 API，J

31、asper.ai 便与 OpenAI 合作推出了文案写作工具（最初是广告文案写作）。随后，Copy.ai 也加入了文案写作领域的竞争。如今，Jasper.ai 和 Copy.ai 已支持包括邮件写作、博客写作、广告文案写作等在内的多个功能，并且支持定义语调等参数。除了文本，AIGC 还可以生成图片、视频等各种形式的内容。例如，在虚拟主持人、虚拟主播方面，AIGC 已经可以实现语音合成和视频生成，并且可以实现观众与主持人、主播之间的实时活动。在 2022 年 12 月 19 日，经过四年的发展，一个以女性 VTuber 为风格的聊天机器人Neuro-sama12在 Twitch 上首次亮相，其能

32、够实时与观众交流，并且可以直 12 https:/en.wikipedia.org/wiki/Neuro-sama.图 5 Jasper 支持的不同付费方案王捷律师团队|AIGC 合规未经授权，不得转载 19 播游玩包括 osu!和 Minecraft 等等游戏13。（二）（二）电商电商在电商领域，目前也出现了为客户推荐商品、讲解卖点的 AI 导购。Secoo 集团通过引入 OpenAI 的 GPT 及百度的文心一言，推出了智能营销模式14。我们相信，在未来，AIGC技术将能够帮助用户实现通过输入自然语言，便可以快速精准地检索到适合自己的商品，如通过输入“宽度小于 50 厘米的黑色金属桌

33、子”，无需翻阅复杂的筛选界面，便可以筛选出同时满足这些条件的商品。在电商领域，虚拟电商主播也是一个新兴趋势。通过使用 AI 语音和视频合成，虚拟电商主播可以进行实时直播，向观众介绍和推销产品。这种新型的营销方式不仅能够吸引更多的消费者，还能够提供个性化的推荐和购物建议，提升用户的购物体验。当然，除了推荐商品外，AIGC 在电商领域亦可以帮助商家撰写商品文案、绘制产品宣传图、使用人工智能客服回复客户问题等。（三）（三）影视影视“AI 孙燕姿”在五月于社交媒体上的大火，以至于孙燕姿本人在其部落格作出回应15。除了“AI 孙燕姿”，亦出现了如”AI 周杰伦“、”AI 陈奕迅“等 AI 歌手。AI 歌

34、手通过“学习”歌手 13 https:/ Secoo Group,Officially Accesses OpenAI and ERNIE Bot,Luxury Goods Intelligent Marketing Scene Will Be More Accurate,https:/ http:/www.makemusic.sg/new-blog/wodeai 图 6 使用“AI 孙燕姿”为关键词在 Bilibili 上进行检索王捷律师团队|AIGC 合规未经授权，不得转载 20 的音色，使得一位歌手能够“唱”出其未公开演唱过的歌曲。另外，音乐类的 AIGC 如今不仅能够模仿歌手演唱，

35、亦实现了根据文本直接编写出一首完整的曲子16。（四）（四）金融金融在投融资领域，2023 年 3 月 GPT-4 发布之际，摩根士丹利便宣布其通过 OpenAI 的 GPT-4 为内部的知识库引入全新的查找信息的方式，省去了内部顾问在不同的网站上阅读大量信息、仅为获得某个特定问题的答案的时间17。图 7 摩根士丹利基于 GPT-4 开发的内部问答机器人一家跨国第三方平台 Stripe 则使用 GPT-4 用于社区平台的欺诈监测，GPT-4 将会分析Stripe 的社区平台上的帖子，并标记账户；同时 GPT-4 也用于扫描服务的访问，用来识别恶意攻击者的行为18。16 Andrea Agos

36、tinelli,Timo I.Denk,Zaln Borsos,Jesse Engel,Mauro Verzetti,Antoine Caillon,Qingqing Huang,Aren Jansen,Adam Roberts,Marco Tagliasacchi,Matt Sharifi,Neil Zeghidour,Christian Frank,MusicLM:Generating Music From Text,https:/arxiv.org/abs/2301.11325.17 https:/ 18 https:/ 王捷律师团队|AIGC 合规未经授权，不得转载 21（五）（五）

37、教育教育可汗学院（Khan Academy）和多邻国（Duolingo）19，通过引入 GPT 4，实现了因材施教。通过接入 GPT 4，可汗学院的 Khanmigo20不仅可以为学生解答问题，同时可以主动提出个性化的问题、促进学生更加深入的学习、理解问题背后的背景。而好未来发布的 MathGPT，则针对数学该特定领域，面向全球数学爱好者和科研机构，推出以解题和讲题算法为核心的数学垂直领域的大模型。（六）（六）医疗医疗一位开放者在 GitHub 发布了其将 GPT 3.5 与 1899 年便出版的默沙东诊疗手册进行结合，实现了通过自然语言便可获得简单医疗意见的代码21。通过及结合默沙东诊

38、疗手册的专业资料和 GPT 3.5 的自然语言处理能力，降低了因普通患者无法准确表述症状而导致无法获得准确意见的问题。除提供医疗意见外，在医疗领域，AIGC 还被用于报告生成、智能诊断等多个场景。（七）（七）其他其他当然，AIGC 所适用的行业不仅局限于我们以上列出的 6 个行业，包括设计22、工业、建筑、制造等多个行业，AIGC 亦发光发热。19 https:/ 20 https:/ 21 https:/ 22 https:/ 图 8 Khanmigo 的界面演示王捷律师团队|AIGC 合规未经授权，不得转载 22 除针对特定行业的 AIGC 产品或服务外，还存在各种针对通用场景的应用

39、或服务。以微软的 Copilot 为例，通过将基于 GPT 的 Copilot 能力嵌入包括 Windows 操作系统、Edge 浏览器、办公通讯软件 Teams、办公软件 Office 等，实现了在多个场景下协助用户生成包括但不限于文档、演示文稿、电子邮件、复杂的 Excel 公式、会议纪要等等多种内容。王捷律师团队|AIGC 合规未经授权，不得转载 23 四、四、典型产品典型产品（一）（一）ChatGPT ChatGPT23，一个人工智能聊天机器人，在推出 2 个月后，便达到了 1 亿的用户，成为了史上用户增长速度最快的消费级应用。ChatGPT 的背后的模型是 OpenAI 的 GPT

40、-3 的改进版本“GPT-3.5“，OpenAI 通过针对聊天场景进行微调并引入 RLHF24（Reinforcement Learning from Human Feedback，人类反馈的强化学习），实现了回答问题、翻译、编写故事、编程、扮演名人等泛用化的能力，且支持众多语言进行交互。在 ChatGPT 之后，OpenAI 也发布了GPT-3.5 和 GPT-4 的 API25，使得开发者能够可以将 GPT 接入自身开发的产品或服务。随着 OpenAI 于 2023 年后半年开放包括 GPT-4 的多模态能力、发布 GPT Store 等，GPT 23 https:/ https:/en.

41、wikipedia.org/wiki/Reinforcement_learning_from_human_feedback 25 https:/ 图 9 使用基于 GPT-4 的 ChatGPT 生成打油诗王捷律师团队|AIGC 合规未经授权，不得转载 24 相关的应用场景不断延伸，包括上传 PDF 文件并根据 PDF 的内容回答用户问题、根据需求制作演示文稿、编写项目工程代码等等。（二）（二）GitHub Copilot GitHub Copilot26是由GitHub推出、基于OpenAI Codex27模型训练的智能编程辅助工具。用户可以在代码中添加注释、调用 GitHub Copi

42、lot，GitHub Copilot 就可以将根据用户输入的注释及代码文件的上下文，编写包括 Python、JavaScript、TypeScript、Ruby 在内的多种编程语言的代码。GitHub 于今年 3 月，在 GitHub Copilot 的基础上，又提出了 GitHub Copilot X28。GitHub Copilot X 可以帮助工程师调试代码、解释代码、生成单元测试等。以 GitHub Copilot 为例的代码生成类 AIGC 服务，其训练模型的数据大部分为来自开源代码库中的代码。但在采集训练数据集，此类服务可能并未区分不同开源代码库的不同类型的开源许可证，确定某个开源

43、代码库的代码是否可进行商业使用。曾有律师向加州旧金山的美国联邦法院提起集体诉讼29，指控包括 GitHub、微软（GitHub 的所有者）、OpenAI 在内的被告违反了开源许可证、GitHub的隐私政策和服务协议、千禧年数字版权法（“DMCA”）等。（三）（三）Stable Diffusion Stable Diffusion30是 Stability AI 推出的基于扩散模型（Diffusion Model）实现的文生图/26 https:/ 27 https:/ 28 https:/ 29 https:/ https:/stability.ai/blog/stable-diffusion

44、-public-release 图 10 使用 GitHub Copilot 快速生成代码王捷律师团队|AIGC 合规未经授权，不得转载 25 图生图模型。与 MidJourney31和 OpenAI 的 DALL E 232不同，Stable Diffusion 是一个开源项目，其源代码与模型权重均于代码开源社区 GitHub 上开源，且可以在中等 GPU 的消费级硬件上运行。Stable Diffusion 的技术原理是使用扩散过程来生成图像，即从一个随机噪声开始，逐步将其转化为目标图像。在这个过程中，模型使用文本作为条件来指导图像的生成，不断检查图片与文本是否匹配，如果不匹配就改变图

45、片，使图片的内容不断地接近文本，从而实现文本到图像的转换。Stable Diffusion 的训练数据是 LAION-5B33，这是一个由德国慈善组织 LAION 创建的互联网通用爬取数据集，包含了 58.5 亿个图像-文本对。但这些数据大多来自于互联网，在采集的过程中并未获得作者的授权许可。三位艺术家便起诉34了 Stability AI（开发 Stable Diffusion 的公司）、MidJourney、DeviantArt 未经授权便使用其作品用于模型训练。31 https:/ https:/ 33 https:/laion.ai/blog/laion-5b/34 https:/ 1

46、1 使用 Stable Diffusion WebUI 生成图片王捷律师团队|AIGC 合规未经授权，不得转载 26 五、五、商业模式商业模式现有的 AIGC 服务的商业模式，根据我们的观察，可分为开源、订阅制、按量计费三种模式。Stable AI 的 Stable Diffusion、BigScience 的 Bloom 模型，采用开源的方式进行公布，不同模型采用了不同的许可证、对模型的使用进行了不同程度的限制或许可（是否可商业使用、是否需要注明原权利人）。部分产品，则采用了订阅制的商业模式。以 OpenAI 的 ChatGPT 为例，目前 ChatGPT 支持免费和按月付费 20 美

47、元两种计费方式。用户订阅月费 20 美元的服务后，可以使用基于OpenAI 最新的、最可靠的 GPT-4 模型的 ChatGPT，可以使用 ChatGPT Plugins 实现例如订餐、查询机票、文献检索等功能。MidJourney 则根据每月更快的 GPU 的使用时长、图片生成队列的效率等因素，推出了不同级别的收费方案。最后一种商业模式，则是按量计费。此类模式普遍面向开发者，开发者可使用服务提供商的 API 将 AIGC 服务接入自己的应用，并按照实际的使用量进行计费。以 OpenAI 的 gpt-3.5-turbo 为例，根据 2023 年 11 月 6 日的最新公告，处理 1000 个输

48、入 Token 的费用为 0.0010美元，处理 1000 个输出 Token 的费用为 0.0020 美元；对于 GPT-4，根据性能的不同（区分8K Content 和 32K Context）和输入 Token 或是输出 Token，收取不同的费用。图 12 ChatGPT Plus 服务的服务范围图 13 MidJourney 不同的收费方式王捷律师团队|AIGC 合规未经授权，不得转载 27 图 14 OpenAI 提供的 API 的计费方式王捷律师团队|AIGC 合规未经授权，不得转载 28 六、六、知识产权知识产权侵权风险与保护路径侵权风险与保护路径（一）（一）知识产权

49、侵权风险知识产权侵权风险 1.数据采集和训练阶段数据采集和训练阶段(1)侵权风险侵权风险人工智能最为核心的三要素包括算法、算力和算据，其中算据被认为是最核心的竞争力，原因在于算据的质量和多样性直接影响到生成模型的表现与性能。生成式人工智能的训练数据集往往涉及大量数据源，其中必然涉及使用受著作权保护的数据，若采用此类受著作权保护的数据进行训练，在生成式人工智能在输出内容时，输出的内容有几率包含训练数据源中他人享有著作权作品的部分或全部特征，故此面临许多著作权问题。对于这部分内容，若不能适用“合理使用”或其他免责事由，则可能引发侵权纠纷。此外，如 AIGC 使用的数据集或文本中存在未经授权使用他

50、人的商标或专利等情形，同样可能导致侵权风险。采集、训练数据过程通常会伴随着数据的复制行为，也就是将收集到的数据复制到计算机或服务器中进行处理和存储。此外，在进行特征提取和降维等过程中，也需要对数据进行复制和重构，以便使用特征提取算法和降维算法进行处理，以便训练模型或生成新的艺术作品或内容，此时，可能构成复制权侵权。另外，上述对数据进行清洗和预处理以及特征提取和降维的过程，虽然并没有完全还原原始作品，但是将会保留作品关键特质，此时可能构成改编权侵权。2022 年，马里兰大学以及纽约大学的研究员在题为 Diffusion Art or Digital Forgery?Investigating D

展开阅读全文