1、学苑AcademyAcademy0引言2022年11月,OpenAI发布生成式预训练语言模型ChatGPT,这一技术在国内外社交媒体上被广泛讨论。AI在内容生产领域的应用更进一步从技术理想走向商业现实,有些机器生成的“作品”在外观上已经非常接近甚至不输人类作品。以ChatGPT为代表的AIGC(生成式人工智能)生产出的“作品”是否具备创造性?未来AI生成的大量文章、小说、绘画作品是否应该像人类作品一样被法律保护?传统的著作权法体系以保护人类智力成果为中心,尚无法很好回答AI生成内容的相关版权问题,而探讨生成内容是否具备独创性是解决问题的关键。1我国司法实践与AI算法生成内容独创性问题1.1我国
2、司法实践倾向于肯定对AI算法生成内容的著作权保护随着深度学习技术的进步,AI的算法逻辑越来越趋近人类智力活动,在内容生产领域AI算法的作用也由单纯的辅助性工具向具有独立自主性的创造机器进化。司法领域就面临AI创作带来的版权保护方面的新问题,在国内为数不多的案例中都倾向于肯定对AI算法生成内容的著作权保护。北京菲林诉某平台的科技案,法院认为涉案文章(原告利用威科先行库选定关键词后使用“可视化”功能自动生成的分析报告)符合文字作品的形式要求,具有一定独创性,但同时否认了软件研发者(所有者)和软件使用者在文章自动生成过程中存在用户思想、感情的独创性表达,进而否定涉案文章为自然人创作的作品。从判决上看
3、,法院认可了原告涉案文章系法人作品的主张,最终以侵害信息网络传播权为由判决被告败诉。不得不说该判决虽然认可了AI生成的文字内容为法人作品,但在判断文章是否具有独创性这一关键要素上的逻辑是矛盾的。另一则被称为全国首例认定人工智能生成的文章构成作品的生效案例中,法院认为涉案文章的特定表现形式及其源于创作者个性化AI算法生成内容独创性与法律保护问题探讨 文 田林川 杜 薇摘要:AI算法生成内容的版权保护问题既是值得研究的学理问题同时也涉及商业应用,当AI产物可以如同自然人或法人作品一样产生市场价值时其版权问题会更加凸显。当前国内并未在立法层面回应人工智能及其创作物的权利归属和法律地位问题,相关司法实
4、践案例也较少,因此尚无妥善方案弥合这一法律漏洞。本文拟在分析我国司法实践案例的基础上,综合不同著作权法体系关于作品独创性的判断标准对AI算法生成内容是否具备独创性及其法律保护问题进行探讨。关键词:人工智能;内容创作;著作权;独创性30China Internet互联网天地学苑Academy的选择与安排,并由Dreamwriter软件在技术上“生成”的创作过程均满足著作权法对文字作品的保护条件。最终法院认为文章是由原告主持的多团队、多人分工形成的整体智力创作完成的法人作品,不但承认了AI文章的独创性,还解释了法院判断其具有独创性的内在逻辑。可见尽管关于人类智力在AI算法生成内容创作过程中是否存在
5、独创性表达上存在争议,法院最终都肯定了作品本身的独创性,并将涉案文章认定为法人作品,保护了AI算法投资者和使用者的利益。从学理上来说,这种判断方式认为AI虽然不能是权利主体但现有著作权法体系可以兼容对AI算法创作物的保护。当前的著作权法是以人类智力为中心来构建起保护对象的,但借鉴成熟的法人作品制度可以将AI机器使用者或投资者视为著作权人,既规避了将AI视为权利主体的风险,又支持了AI生成内容可以受到现有法律体系的保护。其出发点是考虑权利制度设计要如何激励更多的、有价值的创造性成果的产生。1.2独创性判断标准的高低是AI算法生成内容著作权保护的关键独创性是判断一部作品受著作权保护与否的关键,不过
6、作为一个重要实质要件,其判断标准却是模糊可变,有高低之分的。不同法系和不同国家因立法价值各异对独创性的判断存在明显差别。英国版权制度侧重保护作品的商业价值和作者的经济权利,采用“额头出汗”(Sweat of the Brow)原则判断作品是否享有版权。英国很早经历计算机技术对传统版权制度的冲击,也最早从立法层面明确计算机创作物的法律地位和权利归属问题。在其司法实践中则一直采用类似“劳动、技能和判断”(labour,skill and judgment)的较低衡量标准,只要求作品必须是独立完成而非复制抄袭,不要求作品是新颖有创造力的。同为普通法系的美国最初也采用“额头出汗”原则,后又在司法实践中
7、衍生出了少量创造性(modicum of creativity)这一新的独创性判断标312023.2互联网天地学苑Academy准,即要求作品满足“独立完成”和“最低限度的创造性”两个要素,因此美国对于独创性的判断标准要高于英国。而以法国和德国为代表的大陆法国家著作权制度深受康德和黑格尔哲学思想的影响,侧重作者与作品之间的人格联系,认为作品是作者人格的延伸,既保护作者的财产权利也重视作者的精神权利,因此对于独创性的要求也更加严格。法国著作权法将作品规定为智力作品,强调作品要反映出“作者个性”才受到著作权保护。德国对独创性要求界定则更高,不仅要求创作应当体现作者的个性和创造性还要求创作要有一定水
8、准,即超出一般人平均水平的智力创作水准。伴随科技不断发展德国的司法实践也开始对一些较低创造性的作品给予著作权保护,尝试使用“一枚小硬币的厚度”标准对数据库、计算机程序等进行保护,认为此类作品创造性的高度只需要一枚硬币那样的高度。可以说AI算法技术的出现对更注重作者人格权的大陆法系国家的法律体系带来的冲击更大。我国32China Internet互联网天地学苑Academy面对这一新挑战在实践中选择采用法人作品制度解决是具有突破性的尝试,但在AI作品独创性这一关键要素的判断上还应该更加审慎。无论从法理基础还是传统的法律价值取向上看都不宜将AI作品的独创性判断标准放得过于宽松,避免使著作权制度沦为
9、资本保护自身利益的工具。关于如何考量AI算法生成内容的独创性判断标准,笔者认为应该坚持以“人”为核心的原则,一方面要衡量AI创作过程中所投入的人类精神含量的多少,另一方面要考虑作品呈现出的人类智力水平的高低,甚至还需要一定程度的考虑到内容受众的感受。2以“人”为本考察AI算法生成内容的独创性高低2.1基于深度学习理论的AI算法创作离不开人类指导“人 工 智 能”的 概 念 虽 然 早 在 1 9 5 6 年Dartmouth学会上就由约翰麦卡锡提出,但时至今日我们依然处于弱人工智能时代。伴随机器学习或深度学习理论(deeplearning)的提出和在语音图像识别领域取得的成功,人工智能技术在各
10、个领域取得较大进展。机器能够具备逻辑和思维是模仿人类大脑机制处理数据的结果,其“智力”是依赖于较强的人工干预和不断“投喂”的大量数据,因此在内容创作领域,AI创作又被称之为“数据驱动的创作”(Data-DrivenCreativity)或者算法创作(AlgorithmforAuthorship)。AI算法的创作是无法脱离既定的程序和算法的,其本质就是人类赋予的一段代码,仅从创作过程看,甚至不符合英国较低要求的“独立创作”标准。未来AI是否可以进化到自行收集、判断和学习数据并独立创作出“作品”尚未可知。从现有的尝试来看完全排除人类在内容生成过程中提供数据和编造程序、算法后产生的成果,无论从技术层
11、面还是受众观感上都无法达到人类创作水准。就像现实中无监督学习(unsupervised learning)的算法模式在大多方面都难以达到理想结果。当然有学者主张对于“独立完成”的要件我们不能单纯考虑是否由AI主体独立自主完成,而只需客观地考察其生成物是否区别于已有作品,只要与现有作品有所不同便可以认定其符合该要件。2.2基于深度学习理论的AI算法创作本质是模仿而非创造AI算法能够进行内容创作是建立在机器对数据库的学习的基础上的。前述案例中涉及的某平台开发的Dreamwriter自动化新闻写作机器人就是由专332023.2互联网天地学苑Academy门的技术人员通过算法设计和数据分析技术让机器去
12、理解和学习数据及其对应的写作模板。其写作的流程分为五个环节:数据库的建立-机器对数据库的学习-就具体项目进行写作-内容审核-分发,其中关键环节是数据库的购买和建立。没有数据机器就无法进行数据的分析与学习,也无法自动量化生成生动的文章。这里的数据库就是大量人类生产的行业稿件的合集,Dreamwriter机器对数据库内的各项数据进行分析,得出字、词在某个句子中相互匹配的概率,接着在写作时选用最有可能匹配的字、词、句进行匹配,生成一篇完整的文章。因此AI算法创作内容的过程实际是在对现有人类作品的重新排列组合,其本质是一种模仿和重复性行为,而并非创造性行为。因此AI算法生成内容的过程是一种创造性极低的
13、行为,其生成内容的创造性不能与人类文学作品中展现创造力相提并论,假设人类文学艺术领域内的作品总量不变,无论AI的算法如何优化,算法种类的数量如何增加,其组合搭配最终结果总是有限的。3AI算法创作存在的问题3.1AI算法创作于内容创作领域的负外部性在内容创作的某些领域,如体育、天气、财经等资讯性较强的新闻报道领域,AI工具的运用可以很好地帮助人来抓取热点信息或解决繁琐、重复的工作。如果将其运用在其它创造性较强的人文社科领域,结果将是灾难性的。以小说创作为例,高质量的内容创作需要投入创作者大量的想象、时间和精力,其作品是作者智力成果的集中体现,蕴含高度的人类智慧和精神力,经典的小说作品可以流传百年
14、,让读者回味无穷。AI难以创作出这样优秀的作品,相反,市面上各类泛滥的AI辅助写作工具让网络写手们在写作过程中能够借其投机取巧,结果就是生产出大量雷同的低质的内容。假如对这种“掺水”作品给予和人类创作作品同等程度的著作权保护,将不断拉低内容创作领域的作品质量,降低创作者独立创作的热情,甚至影响著作权保护体系的平衡。3.2倾向保护AI算法生成内容可能导致版权垄断从著作权法目标价值来看,著作权保护体系建立旨在通过赋予作者权利,同时维护各主体间的利益平衡,进而激励科学艺术文化领域的创新与传播。著作权体系的特殊性在于它尽可能保护作者的私权利并且为公众留出充足的公共领域,正如洛克于论出版自由中提出的,作
15、者权利应当受促进知识增长与传播的社会性目标限制。随着经济和科技的快速进步,著作权呈现出不断扩张的趋势,著作权的双重属性决定了盲目扩张容易导致现有制度沦为资本逐利的工具。如果参照现有法人作品制度承认AI算法生成物的著作权,未来将有数量庞大的AI生成内容获得法律保护,其著作权将归属于软件研发者(所有者),往往就是那些互联网巨头公司所有,长此以往就有可能产生版权垄断。34China Internet互联网天地学苑Academy参考文献:1 汪煜.深度学习视阈下算法生成内容独创性之证伪J.江南论坛,2021(09):41-43.2 吴汉东.人工智能时代的制度安排与法律规制J.法律科学(西北政法大学学报
16、),2017,35(05):128-136.3 王可可.人工智能创作物的定性分析J.法制与社会,2018(20):211-212+216.4 杜媛媛.人工智能创作物的著作权归属问题的探讨J,法制博览,2018(16):139+138.5 梁志文,李忠诚.论算法创作J.华东政法大学学报,2019,22(06):46-59.6 史勤艳.论作品独创性的判断标准J.山东审判,2005(06):75-78.3.3保护AI算法生成内容忽略了内在不公平性AI创作的前提是对海量数据的理解和学习,涉及对已有作品的二次创作,但因为来源过于广泛往往难以鉴别这些被二次创作的作品是否属于受版权保护的作品还是来源于公共领
17、域抑或是二者兼有。假设其来源或部分来源于已经属于公共领域的作品,那生产出的内容是否可以完全受到著作权法的保护。另外,AIGC模型依靠从网络上收集的海量数据进行训练,整个过程通常未得到素材创作者的知情或同意。那些被作为训练数据的作品来自于“众多创作者”的创作成果,他们数量庞大但他们的权益将很难被保护。因此即便在以后的立法和司法实践中明确AI算法生成内容受著作权法体系保护,也应考虑及时增设新的合理使用制度来维护原有著作权法体系的利益平衡。3.4商业化的AI创作工具会加剧数据垄断在了解AI创作工具背后的技术逻辑后会发现其实践方式是带着掠夺和剥削性质的。想训练出高水平的AI创作工具必须依靠强大的大数据
18、平台,而有能力购买和建立如此庞大数据库的只有类似chatGPT背后微软那样的互联网巨头公司,这些寡头公司在未来的AI开发和应用过程中有可能会毫无顾忌地抓取全球数据用于训练。如果法律的天平过分倾向于这些寡头公司会加剧利益集团对公共领域和私人权益的掠夺性使用,最终损害公共利益和社会创新。4结束语AI生成内容迄今为止大都高度依赖应用、算法、规则和模板,随着深度学习技术的进步AI算法生成物中人的意志和智慧能够更加灵活自然的体现。我们不能完全否认AI生成内容的创造性和可版权性,但AI创作本身还存在诸多问题,过度保护会带来潜在风险。未来应该在不损害原有著作权法体系的基础上兼容对AI算法生成内容的法律保护,同时把握好各主体之间的利益平衡,坚持著作权法的立法价值和目标。面对AI创作这一数字经济时代的全新生产方式,法律在为其发展保驾护航的同时也要时刻警惕,不要让创作和创新被资本过分绑架。作者单位:国家计算机网络应急技术处理协调中心 长安通信科技有限责任公司 从著作权法目标价值来看,著作权保护体系建立旨在通过赋予作者权利,同时维护各主体间的利益平衡,进而激励科学艺术文化领域的创新与传播。352023.2互联网天地学苑Academy