创作型人工智能应用下作者“数据控制权”的提出.pdf

资源描述

1、投稿网址：创作型人工智能应用下作者“数据控制权”的提出任庭汉（云南大学法学院，云南昆明6 5 0 5 0 4）摘要：当人工智能使用作品作为数据来源并制造产物时，可能无法构成合理使用。现有著作权法仅规定了控制作品电子存储行为的复制权，缺少对“数据使用”行为的控制。使数据处理者在获得电子存储的复制许可后，可以利用权利要素的缺失，自由使用创作型人工智能生成数据产物，对作者利益造成损害。基此，提出了作者的“数据控制权”，并通过案例分析、文献研究等方式，论述“数据控制权”设立的正当性、合理性并进行框架建构，填补著作权法中数据权利要素的缺失，对作品的数据权利进行针对性的保护，同时也兼顾了作者与数据处理者的

2、利益，为人工智能的数据使用的行为，提供了一种基于数据权和著作权相结合的保护思路。关键词：创作型人工智能；数据使用；数据控制权中图分类号：D923引用格式：任庭汉创作型人工智能应用下作者“数据控制权”的提出J网络安全与数据治理，2 0 2 3，4 2（9）：50-58.文献标识码：ADOl:10.19358/j.issn.2097-1788.2023.09.008The proposition of authors data control rights in theapplication of AI generated contentRen Tinghan(Law School,Yunnan

3、University,Kunming 650504,China)Abstract:When artificial intelligence uses works as data sources and manufactures products,it may not constitute fair use.Theexisting copyright law only stipulates the right of reproduction to control the electronic storage of works,and lacks the control of data use b

4、ehavior.After obtaining the replication license of electronic storage,data processors can use the lack of rights ele-ments to freely use AI generated content to generate data products,which will damage the interests of authors.Based on this,thisarticle puts forward the authors data control right,and

5、 through case analysis,literature research and other methods,discussesthe legitimacy and rationality of the establishment of data control right and carries on the framework construction,flls the lackof data right elements in the copyright law,protects the data right of the work,and also takes into a

6、ccount the interests of the au-thor and the data processor.It provides a protection idea based on the combination of data rights and copyright for the behavior ofdata use in artificial intelligence.Key words:AI generated content;data using;the right of data control0引言人工智能自2 0 世纪产生之后，发展至今已实现量变到质变的飞跃，

7、成为影响人类社会活动的重要因素之一，同时也带来了对作品数据使用等诸多问题。一方面，人工智能可能会因电子复制行为侵害作者复制权（域外有“tdm例外”的原则，在法律界常常讨论）。另一方面，人工智能使用方也可以在不侵害作者享有的复制权等权利基础上进行使用。表面上看，这是一种对“作者无法使其发挥价值的”数据部分的利用，属于“合理使用”范畴。但是，一旦将作品数据“喂”给创作型人工智能，生成新的“作品”就可能与原作者形成竞争关系，损害原作者权益，并使合理使用失效，现有法律却鲜有针对性规范。对此，应当给予作者一种对于作品的“数据控制”权利。另一方面，企业在大数据的处理上付出了投5012023年第9 期（第4

8、 2 卷总第5 5 7 期）计算法学Computational Law人，理应享有财产用益的权利，包括数据的直接使用与以该数据所体现的性质来看，可以分为人身性数据和财数据的交换流通等权益。如果作者的控制力量过大，可产性数据。人身性数据又可分为敏感性数据与非敏感性能就会使企业的用益权受损，阻碍企业乃至人工智能产数据。前者又被称为个人信息，其上客体个人信息权被业的发展。这明显与我国数据政策的导向不符。如何视为一种利益或权利，是人格权的延伸，属于个去论证并建构一种有限的“数据控制权”，实现作者和企人信息保护法保护客体；后者则指经匿名化处理后，业利益的共赢，是本篇文章讨论的主题。人格因素较少的个人信

9、息数据，如出行数据、购物数据1人工智能数据使用现状等。该类数据并非个人信息，不受个人信息保护法1.1人工智能与数据使用关系保护。一般认为该类数据的权利归属应当属于企业【。而财产性数据可分为虚拟财产和“上传数据”。前者指账数据，指对现实中某种事物的关系与性质进行的表号、游戏财产等虚拟财产，通说为归于民法债权保护征记录信息 2，在计算机的应用背景下，也可以指以计（见把手案例北京市丰台区人民法院民事判决书，2 0 2 1算机等信息技术硬件为载体的信息。数据的价值在于，京0 1 0 6 民初3 0 8 3 号）；而后者则专指那些“具有作品外海量数据经过挖掘整理后，可以获得蕴含在其中的有效观特征的内容或

10、产品（works）”，在诸多“产品”的知识信息 3 。因此，数据往往被当作为一种抽象物存（w o r k s）中，可以分为“受著作权保护的作品”（works在，被认为是一种知识、一种财产，在其之上的权利可withcopyright）与“不受著作权保护的产品”（workswith-以被认为是一种财产权、一种知识产权 4，亦或者是一out copyright）。前者指作者上传的，以数字形式存在的种独立的产权。它可以作为一种生产要素作用于生作品，如网络写手上传的小说，网络画手上传的画作产 6 。所以本质上，它可以被看作是“一种不能穷尽但等；而后者则指那些虽然有作品形式要件，但因欠缺独却不一定能够使

11、用的资源。”7 随着对这种资源需求的增创性而不可算作作品的“产品”，如无意识中误触快门加，数据技术应运而生，而人工智能，是计算机学科下拍下的模糊图片、临摹或拍摄的公共领域画作、使用人的一类，其最开始的目的是为了模拟学习或智能的所工智能生成的产物等。因为缺乏著作权的保护地位，这有方面。随着数据技术的发展与人工智能技术对数据些“产品”便可自然而然地归于公共领域，可以自由量的需求，人工智能与数据领域进行了深度融合，发展使用。出了现代人工智能。对于现代人工智能来说，数据是人源于公共领域和来源于企业领域等非个人数据是人工智能技术能够实现的必要条件，通过数据输人和数据工智能数据的另一部分重要来源。所谓公

12、共领域的数据，技术的方法应用，基于如神经网络等数据要求的人工智是指政府、公益组织或其他个人所公开的，具有公益性能技术才能实现，进而实现现代人工智能的相应功能；质，可以自由使用的数据，典型的例子有天气数据、政而对于数据技术来说，人工智能既是数据技术领域下的府统计数据以及上文所提及的归于公共领域的“产品”多项子技术与人工智能技术融合而来的技术产物，又是数据等。来源于公共领域的数据并不一定代表来源于政达成数据技术目的的重要辅助技术。现代企业可以通过府。政府公布信息、公布数据的行为，本身是一种行政对人工智能与5 G、数据平台等其他技术的融合应用，对行为，具有服务性和无偿性。但是，不能因此而说具数据进

13、行更智能的处理分析，并达到最大化挖掘发展背有服务性和无偿性的行为都是行政行为。可以行使这种后价值的最终目的。综上，人工智能本质上既是一种行为的主体不一定仅指政府，一些公益性组织、知名高可以产生数据产物的数据方法，也是一种基于数据方法校、知名专业智库等主体都可以行使类似行为，并生成产生的数据产物。数据的使用，是为了达成人工智能设公益性数据。相比较其他几个来源而言，公共数据的源计目的所必须的前置步骤头较为杂乱，产生的源头可以是政府、企业甚至个人。1.2人工智能使用不同类别数据现状公共领域中的数据，最典型的特征就是因主体行为服务人工智能数据来源极为广泛。按照数据的归属，可性和无偿性，从而产生客体对

14、象即数据的公益性。这使以将人工智能的数据来源分为来源于个人领域的数据和它可以被自由使用，进而使得我们在研究数据权属运行来源于非个人领域的数据，在非个人领域中，又可分为时，不必单独考虑主体权利行使状态，因此公共领域数公共领域的数据和企业领域的数据。据独立于二者进行平行分类。所谓来源于个人领域的数据，指来源于个人在网络企业来源的数据是指来源于企业付出劳动与财产所生活中所产生的各式各样的数据，如自然人在网络购物得到的专属于企业的具有商业价值的数据。这些数据可时留下的购物痕迹，在网络聊天时留下的聊天记录等。能直接取得，如企业运行中的金融数据、商业数据等，2023年第9 期（第4 2 卷总第5 5 7

15、期）丨5 1投稿网址：也有可能间接取得，如上文中提到的经企业匿名化处理后的个人信息数据，亦或是从别的企业购买或合作得来的数据集。但无论是哪种方式取得，企业数据都必须归企业所控制，未经许可使用企业数据的行为，可能违反反不正当竞争法相关法规4 1，如果人工智能处理源于数据来源使用自由无限制公共领域来源于商业合作、数据市场等，未经许可使用可能涉及违法企业领域图1 人工智能数据使用范围2“数据控制权”设立的正当性针对创作型人工智能使用致作者利益受损的情况，应当设定一种作者享有的“数据控制权”，去控制这种“使用数据”的行为，以此来实现对著作权利益的实质保护，防止合理收益的损害。本段将基于现有法律不足和宏

16、观利益的观察与考量，对“数据控制权”进行正当性论证。2.1现有法律回应的不足现有著作权法对人工智能使用作品数据的规范方式有两种：合理使用与复制权控制。在大多数情况下，作品数据的使用可以满足合理使用的三要件并归于合理使用。当一个作品以数据形式出现时，可以被视为包含了广阔信息的资源库。在这个库里，包含作品的表达、思想、数据等知识内容。人所能够使用的，仅仅是作品的表达与思想，对数据生产要素却无法使用，造成了数据生产要素的浪费。只有对海量数据进行挖掘获得有效数据，并进一步整合获得信息3，才能实现数据的价值。这个过程需要投入大量的人力物力，是个人所难以达到的，也就难以发挥数据的价值。而人工智能是一种“数

17、据方法”，人工智能生成物生成的过程，归根结底是对作品数据的利用过程，其使用的恰恰是作品价值中被浪费掉的数据部分。对作品数据进行分析处理的过程，本质上是使用“一个开放的资源中未使用的部分”，并没有损害作品基于表达与思想层面的正5212023年第9 期（第4 2 卷总第5 5 7 期）企业数据的内容，则必须获取相关的许可。本文主要讨论人工智能处理数据中以个人数据为来源，涉及著作权法所保护作品（works with copyrights）的内容。为理解方便，兹以图1 对该部分讨论的人工智能使用数据范围与关系做出说明。受个人信息法保护个人信息人身性数据匿名化的个人信息，为企业所有匿名化信息个人领域通说

18、为受民法保护虚拟财产财产性数据具有作品特征的内容非作品常使用。而在某些情况下，作品数据的使用，可能还会间接地给作者带来便利。在合理使用状态不明的情况下，就应通过判断行为人是否侵犯了其他主体权利的行使来判断是否侵权。我国著作权法第十条第五款关于复制权行使包括“数字化”的规定，意味着未经作者许可，将作品以数据形式上传存储至服务器的行为会被认定为侵害作者复制权。而该行为几乎是所有数据处理与分析技术所必须的硬件步骤。理论上来说，著作权法通过对这种必要的客观行为予以权利控制，达成保护作者权利的目的。然而，这种保护模式存在着不足。现有合理使用制度所需的三个要件，在创作型人工智能使用数据的背景下无法适用。创

19、作型人工智能在使用了作品数据后，新生成的“作品”流人市场，就会与原作品形成一种竞争关系，大量挤占传统作品市场。这种竞争究竞有没有损害作品的正当利益，难以解释。而合理使用又是一种“二分”式的判断，即要么构成侵犯著作权，要么属于合理使用，后者既不需要获得许可也不需要予以赔偿，此时，对于作品数据的使用是否属于合理使用只能归于非合理使用之范围，进人侵权领域。但是，复制权的设置仅能控制将作品复制到载体上这一种行为，在此之后的使用不影响法定权利则不受控制。而现有作品平台相关的服务政策，也大多仅规定了作品著作权归属作者而不发生转移，基于实现目的在法律允许范围内进行有限作品没有独创性的内容或进人公共领域而无法

20、算为著作权意义上的作品本篇讨论内容计算法学Computational Law复制存储等，唯独缺少对作品数据的使用说明。著作权法没有规定数据权，因此，数据控制者可以根据该条款，将作品合法复制到服务器后，在不侵犯其他权利的基础上对数据进行自由使用。以域外视角来看，人工智能的数据使用行为是可以获得版权例外的合理使用的，该例外原则来源于欧盟数字化单一市场化版权指令。在最初的数字化单一市场版权指令（提案）中，达到版权例外的要求有四个，分别是主体目的的限制、来源合法、行为方式限制和安全保存措施 1 5 ，而现有的数字化单一市场版权指令中，对版权例外的要求则被削减为两个 1 6 ，仅剩来源合法与安全保存措施

21、，对于主体目的的限制去除与范围扩展是最大的变动。有学者认为，这是为了贯彻“阅读权应当是挖掘权”（right to read should be the right tomine）的理念，即单纯实施数据挖掘的权利实质上等同于人类通过阅读来获得知识或信息的基本权利 6 。也就是说，该指令对待机器阅读作品的“权利”原则，与“人工阅读的权利”划等号。不过，机器阅读毕竟不同于人工阅读。自然属性的人行使“阅读权”，在阅读他人的作品后进行的创作行为，就面临着著作权法上的诸多限制，作者不必担心人工阅读的“阅读权”行使会给自身带来风险；而机器属性的人工智能行使“阅读权”，在输人数据进行算法处理后的输出行为，则难

22、以认定该行为的性质。人工智能数据库利用算法形成作品的“独创性”一直饱受争议，因为人工智能的生成物被认为是一种“缺失思想的表达”1 7 ，只是一种基于数理逻辑的运算结果。著作权认定复制权侵权的路径是依靠“接触思想表达的实质性相似”的模式进行的，当涉及思想表达的作品“独创性”无法认定时，这种模式就会失效，进而造成侵权的认定困难，从而给法律适用带来混乱，也给作者带来竞争利益受损的可能风险，间接激化人机矛盾。2.2数据时代的必然要求作为一个已经蓬勃发展了几十年的技术，人工智能早已从理论走向了商业应用面。从战略层面来讲，人工智能的开发与应用是世界主要发达经济体的国家发展战略，也是我国的重要战略布局 8

23、。由于人工智能不当使用制造的社区冲突也逐渐增多，直接体现了“人机”之间的知识产权与竞争的矛盾。其本质究竞只是如“汽车替代马车”一样历史规律下的阵痛，还是“高效但低（零）质”的“不当”智慧财产竞争？学界仍然缺少一致的结论，并造成了人工智能相关法律规范的缺失，呕待法律介人调整。2 0 2 3 年4 月1 1 日，为促成生成式人工智能技术健康发展和规范应用，根据中华人民共和国网络安全法等法律法规，国家互联网信息办公室起草了生成式人工智能服务管理办法（征求意见稿），向全社会公开征集意见，并最终于8 月正式生效。在第七条第二款中，明确规定了“用于生成式人工智能产品的预训练、优化训练数据，应当满足（二）侵

24、犯知识产权的内容”1 9 。所谓侵犯知识产权的内容，在著作权法框架下，指的是训练内容或行为，对著作权法第十条下的所规定的作者独享的十七条权利的排他义务违反，且该违反行为不构成合理使用。然而，要判定是否侵犯著作权，首先应当判定行为是否构成合理使用，然后判定该行为具体侵犯了哪一条权利。如上文所讲，生成式人工智能使用作品数据的行为面临着一个法律困境，即持有者可以在获取复制权许可后实施“不合理但合法”的数据使用。造成这样的原因是在著作权权利框架中缺少对“数据使用”行为的控制标准，造成“无权可依”的情景，进而给著作权侵权的认定增加困难。如果不在著作权法中对数据控制的行为加以权利形式划定边界，在不根据著作

25、权法第十条的十七款内容对“侵犯著作权”行为做出扩张解释的情况下，易造成办法中第七条第二款的规定的保护程度不确定。因此，设定有限的“数据控制权”就成了一种可行的解决方式。3“数据控制权”设立的合理性目前，我国数据法尚未建立起系统的数据财产权保护的法律体系 2 0 ，但是，对于旁系的个人信息数据的保护已有相应的立法与研究，并已累计丰富研究成果 2 1 。其中，数据权利束相关理论和数据三主体的研究可以为作者数据权利的合理性提供有力的理论来源。本节将基于二者理论内容，对“数据控制权”做出理论论证，构造设立其合理性。3.1数据“权利束”的存在数据作为一种抽象的财产，其客体权利是一种抽象的财产权，是权利人

26、对特定数据享有的直接支配和相对排他的权利 2 。作为一种财产权，这种权利亦是一种权利束（a bundle of rights）2 ，一种具有着多样性结构且内部权利可按照不同分类分割的权利集合。在霍菲尔德的著作中，将传统的“权利一义务”模块拆解成具有排他请求效力的“权利一义务”关系、具有自主使用自由的“自由”关系具有独自处分的独有“权力”关系，和独自享有使用自由和处分不受他人限制的“豁免”关系四大基本法律关系元。因此，作品的数据使用权可以霍菲尔德的视角，分成：“阻止他人利用的对世权”；自由使用的“自由”；单方授权或处分，他人只能接受的“权力”；对数据的处分不受他人影响的“豁免”2 4 。最终，数

27、据2023年第9 期（第4 2 卷总第5 5 7 期）丨5 3投稿网址：财产权就成为了一种集控制、使用、收益、处分等权能为一体 2】，人格权与其他利益相互交融的一种集合权利束 2 5 ，以权能为界定标准，可以认为它包含了控制权、使用权、处理权、收益权权能，这些权能本身来源于对于具体原生权利的保护扩展至衍生利益。可以认为属于数据权利束中该数据权所控制的权利范围，就是著作权所控制的部分权能在数据利益角度的衍生与继承的范围。作品作为一种智慧财产，其数据之上的相关利益就是一种财产的衍生利益，基于财产权的保护原则，这种利益就应当被考虑在排他性控制的范围中。当这种利益基于其特质无法进行完全排他时，“权利束

28、”理论便可以成为这样一种权益的保护进路，设立有限“权利”，使之成为数据权利中，某些新型权益的通用设定原则。3.2数据生成者的主体地位根据数据法理论，数据权利义务主体可以分为三种：数据生成者、数据生产者与数据控制者 2 6 。数据生成者指产生数据的原始主体。上网的个人，在服务器中留下了个人信息，此人就是数据生成者。数据生成者无法利用和生产数据价值，没有数据财产权，其享有权利更多基于原有权利的延伸，如个人信息权，不享有数据财产权，该权利是人格权的延伸。数据生产者一般指企业，因其在数据处理过程中投入了财产与劳动，根据劳动价值理论 2 7 而享有数据财产权，下属权能包括数据采集权、数据可携权、数据使

29、用权与数据收益权等 1 3 。数据控制者则指的是单独或者与他人共同确定数据处理目的和手段的自然人或法人、公共机构、代理机构或其他机构 2 6 与前两者不同的是，数据控制者以义务承担方的形式出现，在设立时并不以数据本身生产过程为依据，而是以生产过程中相对主体的权利行使为依据，数据生产者在使用数据生成者的数据进行生产时，就会基于生成者的在先权利，从而自动获得控制者的义务承担地位，并应在实现本身权利之前履行相应义务。数据企业在参与数据的处理时，根据这个过程中企业参与程度的不同，可以这种数据分为自生数据与非自生数据 2 。自生数据即数据产生者所产生的数据，是产生者权利的来源，也是控制者义务的来源。非自

30、生数据指生产者生产的数据，是生产者权利的来源。作品数据属于自生数据范围内，受在先权利的保护。人工智能是一种“数据方法”，其利用作品数据生成“作品”的过程与结果，本质上是相关主体如企业等数据处理者，通过各种手段从其他数据主体处收集数据后，形成新数据产品的过程结果。作者作为作品数据的产生者，可基于这种在先数据的特性，成为数据产生者并占据该主体地位，进而享有数据产生者的权利，而企业则拥有生产者权利，5412023年第9 期（第4 2 卷总第5 5 7 期）但是作为数据控制者时，必须履行相对于在先的产生者权所控制的排他义务。综上所述，从客体角度来说，作品数据权作为一种数据权，因其财产“权利束”的本质，

31、使得知识产权对其设立控制权能存在可能性。而从主体角度来说，拥有作品的作者，作为数据生成者，也应当享有对应数据控制者的数据控制性权利的地位。本节通过使用数据权利束和数据生成者主体理论，对数据权利客体和主体进行研究，论证了作品数据权利构建的合理性。在下一部分，将基于二者的角度，对作品数据权利做出相应构建架构。4“数据控制权”的建构“数据控制权”可以被总结为：在特定情景中，他人必须获得作者许可才能享有对作者作品进行某些数据处理行为的自由，且在获取这种自由后，不得滥用这种自由侵害作者的其他合法权利。即，以创作为目的的人工智能所有者对该数据享有的处理权，必须依靠作者的授权而获取，且在行使的过程中，需履行

32、除必要存储行为所属的复制权之外，其他著作权及相关权利带来的相对义务。该权利与义务主要基于“数据生成者-数据控制者”模式框架和智慧财产权的特性，是作者著作权利益的延伸，给予了作者一定程度的知情一选择权与收益利益。另外，数据权作为一种抽象财产权，在研究它的权利构建时，也必须考虑到这种权利的构建对社会利益所带来的可能影响，并设置相应的合理使用制度保障社会公益的正常行使，尤其是当权利人事实上不能够使用数据时，就不应该对该类数据的处理做出过多限制，以促进数据使用者利益及数据本身的价值实现。对于作品的数据使用的控制，并非是为了保护作品数据本身，而是为了保护作者著作权相关利益的实现。由此，就应当对这种控制进

33、行一定条件的限制，尤其是当这种控制可能影响数据使用者的合理利益时，如合理范畴的文本挖掘。对于作者“数据控制权”的设定，应当兼顾二者利益，做到既保护作者利益，又保护数据企业利益。对作者对作品数据的控制应当做出设置并设定限缩条件，并以限缩条件下的保护为基础建立作品“数据控制权”保护的框架构造。4.1“数据控制权”的权项内容“数据控制权”的具体权能可分为知情决定权（即，opt-in或opt-out201，下文称为知情同意权）与侵害防止请求权。根据权利束理论，可以将这两种权利分为四项权能，即：阻止他人利用的对世权利，如侵害防止请求权；尽管极其有限，但为了防止出现主体矛盾，仍计算法学Computatio

34、nal Law应承认的对数据自由使用的“自由”；单方授权与处分，他人只能接受的权力，如对于数据授权使用的许可权力；对数据的处分不受他人影响的豁免。在这种视角下，“数据控制权”的权能内容便可以被分为“控制”与“收益”两大权能。描述“数据控制权”的第一项权能内容，就是“他人必须获得作者许可才能享有对作者作品进行某些数据处理行为的自由”。在这种以授权为主要内容的权利之下，知情同意权成了控制权的核心。所谓知情同意权，其翻译为opt-in或opt-out，该单词由“选择”（option）与“人或出”（in or out）组成，也就是说，这种权利，可以作为“知情选择”模式被拆开，权利客体是一种作为形成权的

35、“选择”，而知情则是这种“选择”的保障。作为一种形成权的保障，这种知情程度与内容要求就应向著作权领域靠拢。这是因为，一方面，作为我国缔约的伯尔尼公约及相关国际条约已将计算机存储行为加复制权范围之内（见WCT第一条，伯尔尼公约1982会议），使AI等数据处理技术无论如何也会“落人版权人宽泛的复制权的范围”2 9】，影响到数据的交换使用，因为每一步存储，都是在把作品进行再次复制。在无法构成合理使用的情况下，考虑到数据交换市场对复制权可能造成的影响，则至少对数据授权许可知情程度的设置，应与复制权进行“对标”，对于数据使用的知情同意，应达到被视为后续的复制权知情许可的程度。另一方面，著作权法保护作品的

36、表达不保护思想，其指向对象为多样且独特的表达，因此，当数据处理后的数据产物出现对应权利客体的表达时，情况则要复杂些，必须要适用“实质性接触”，“思想一表达”等原则判断是否为实质性相同，以此为基础确定是否侵权及其因果，往往无法以简单的因果关系来证明该数据产物是否侵犯了作者的复制权。算法的“思想”缺失，使“思想一表达”判断范式可能难以应用至算法控制的输出产品。因此，对作品数据使用的许可，还应使作者能够预见到，“可能产生无意识的雷同表达”后果。需要注意的是，“数据控制”只是一种单纯的授权控制，其授权对象仅限于自身作品数据的使用自由而非其他。以权利束视角来看，作者本身缺少主动使用数据的能力，权利束理论

37、中所谓的自由使用亦与企业对数据的自由使用不同，该使用事实上指的是使用数据所映射的对象或客体。作品是作品数据的映射。在这个过程中，所谓“授以自由”，指的是对映射对象客体的授权自由，而非数据本身的使用自由。“数据控制”的本质，是限制数据处理者数据处理自由的一道“阀”。“数据收益”是“数据控制权”的第二项内容，不过更多作为一种“可得利益”而出现，其内涵是，著作权客体本身为一种知识财产，作为一种通过独创性劳动获得的财产权，具有使用价值与交换价值，可以通过使用、交换等手段发挥作为财产的最大效益。在整个数据产生与处理过程中，作者付出了劳动投入，为数据产物增加了劳动要素上的价值，相比在“劳动”与“财产”两要

38、素都欠缺的个人数据产生过程，作品的单个数据输入，为可用数据集的产生提供了基于劳动的价值，在数据生产过程中起到了积极的作用。按照劳动价值理论 2 7 ，理应获得更多财产地位，在交易过程中收益利益受保护。这意味着数据控制者使用作品数据时，作品数据的生成者可以基于作品数据的使用而获取报酬。也就是我国著作权法中，第十条第十八款所规定的“获取报酬”的利益。但是，一方面，单个作品的数据究竟对企业使用该数据形成的数据集的影响有多少，难以总结客观规律进行界定，尤其是当数据量庞大时。另一方面，数据收集者的采集数据要合法取得，在该过程中可能已经直接或间接地对数据生成者支付报酬，重复获利没有实际意义。出于大数据环境

39、下数据收集者的利益保护原则，这种收益应被限定在“可以”获取报酬且不得重复受益的范围。至于是否“应当”，则应结合具体案例中，不同作品的数据使用对数据集的功能所产生的影响，来具体判断。4.2“数据控制权”的合理限缩对于“数据控制权”中出现的利益冲突，合理使用制度是一种可行的调和方式。其价值目标在于通过均衡保护的途径，促进科学文化事业发展。作者的“数据控制权”控制数据的使用，对有价值数据应当进行共享并最大化发挥其应有的价值。不可过分保护，防止出现“数据孤岛”的现象，最终影响整个数据产业的发展。“数据控制权”的合理使用条件与限缩是指，数据的使用并非全部都需要“知情同意”。对于将作品的数据用于非生成式人

40、工智能的其他领域来说，只要满足伯尔尼公约中，对作品的合理使用三要件，那么，对作品数据的权利，也可以适用于合理使用。因为合理使用制度并非是“合理使用”作品，而是合理使用作品之上的作品作者享有的权利 3 0 1。而作品的数据权利恰恰是作品作者享有权利的一种。所以，合理使用对权利行使的限缩就可以应用至数据权利的限缩。数据控制权的限缩还应表现在对数据市场的控制力上。前已论述，“数据控制权”的内容是“以创作为目的的人工智能所有者必须获得作者许可才能享有对作者作品进行某些数据处理行为的自由，且在获取这种自由后，不得滥用这种自由侵害作者的其他合法权利。”但是数据原发者拥有的数据所有权和2023年第9 期（第

41、4 2 卷总第5 5 7 期）1 5 5投稿网址：处理者拥有的数据用益权的二元权利结构 3 1 ，使得原发者单方对于这种权益的过度“排他”势必会引起处理者利益的受损，间接损害数据产业利益。因此，“不得滥用这种自由侵害作者其他合法权利”并非可以扩展至所有侵权行为。在同一对象上存在不同权利主体并非是新有现象。早在著作权设立之时，便已存在“同一物上存在两种权利主体”的情景，一幅画作，其上既存在所有者的物权，又存在著作权人的著作权。而著作权最终通过对相应“行为”自由行使的限制（对物权中的收益行为进行一定程度的限制），以控制“行为”的方式控制了部分权利，完成了物权与著作权的分离。如果以这种“行为权利”角

42、度来审视人工智能使用作品数据行为中，存在的权利或权益冲突，可以发现，对于数据处理者的行为基于一定原则做出分类讨论，便可以做出区分不同权利或权益的边界。对于该边界可以以两种方式来综合判断，并划人是否属于合理使用范畴。(1)“类同”可能性。前文已述，“控制权”的设立需建立在已有技术措施版权例外理论的基础上。该基础上的“机器阅读权”本身是一种合理的使用自由，但是机器阅读后的“创作”会影响这种自由。因此如果能从“创作”角度作出直接分析，则可以对该限制作出初步区分。人工智能对数据的使用过程一般是通过对数据的提取分析，形成一套固定表达模板，这种模板会受到数据来源的抽象表达技巧与风格影响，生成的产物便会具有

43、相似的特征。因此，一旦数据的来源较多，则这种生成物上附着的个性化内容就会被减弱，变成一种公共领域的大众化表达的体现 3 0 ，构成合理使用可能性较大，而当这种数据来源于单一或少量作者，则这种表达“类同”效应就会被大幅放大，很可能不构成合理使用。当然，用这种判断方式并不能直接推断出是否侵犯复制权，因为它依然无法逃出对人工智能生成物“独创性”判断的矛盾。但是，“抽象表达”使用来源数量的不同，可以使机器的表达产生从单一模仿表达到大众化表达的质变，进而影响实质一致的认定。理论上来讲，数据来源量越多，机器表达中构成的公共要素就越多。因此，对这种“创作”是否影响“机器阅读权”的考量，便可以以数据来源量为自

44、变量，判断构成“实质一致”或“类同”的因变量倾向，进一步考量构成合理使用的可能性。(2)目的导向性。尽管在欧盟现有的版权指令中否定了研究功能作为唯一目的，然而基于版权例外的目的视角来说，它5612023年第9 期（第4 2 卷总第5 5 7 期）仍然是一种有限开放的条款 3 2 。事实上，对于人工智能的合理使用而言，无论是欧盟的版权指令，还是美国的转换性使用的判断，都或多或少体现了目的导向的判断理念。尤其是转换性使用，更是将之作为判断的第一要素 3 。因此，对于“控制权”的合理使用，亦需要考虑使用者的目的来判断。“只有以创作为目的的人工智能才能受到控制权的影响。”现实中，并非所有人工智能的数据

45、使用行为都会涉及创作，也并非所有创作性的人工智能被开发出来时都具有创作的目的，其中也会包含大量服务型人工智能、工具型人工智能。这类人工智能出于功能要求，不可避免地可能会产生创作功能。但是究其本质仍然属于服务性人工智能。不过，创作型人工智能和服务型人工智能往往界限模糊，如ChatCPT本是一种服务型人工智能，然而部分使用者却将之使用在了创作领域，使之变成了“创作型”人工智能；一些真正为了创作而生的人工智能也可能在使用者手里变成辅助工具，成为服务型人工智能。因此，单纯以功能、算法为视点可能无法完整把握人工智能数据使用的目的。对于人工智能数据使用目的判断应当从作品利用行为与著作权法定权利所预期的市场

46、交易行为之间的关系进行综合考量 3 。因此，应当结合人工智能的设计预期目的、使用功能，以及面向使用者的具体服务条款、版权条款等多方面因素，来衡量人工智能的数据使用行为是否接近于“创造”的目的，进而判断是否属于合理使用的范畴。这两种方式的划分都属于一种相对区间判断，使得在判断该行为的边界时，会基于二者变化出现四种情况（如图2 所示）。当“类同”可能性相对高且使用目的接近“创作”时，该种使用行为不属于合理使用与限缩范围，受到数据控制权控制；而“类同”可能性低且使用目的远离“创作”时，该行为属于合理使用与限缩范围，不受数据控制权控制；而当该行为落在第二、四象限时，则需根据具体行为以及离一、三象限的远

47、近具体分析是否适用数据控制权的限缩与合理使用。个类同可能性高不属于具体分析合理使用目的远离创造属于具体分析合理使用类同可能性低图2 目的与类同判断表目的接近创造计算法学Computational Law5作品数据权利保护的现实路径选择时促进作品数据的合理使用。另外，法律也可以采用行“数据控制权”的现实保护路径选择主要有两种方政登记等手段3，对这种作品市场中的“人机”混合竞式。其一是通过直接进人著作权法领域进行保护。“数据争关系进行分离，减少积极损失，进而减轻作者在行使控制权”是一种作者权利，因此可以被著作权法第知情权时的顾虑，增加数据的规范使用比例，促进作品十条所吸收作为一项额外权利。而对于该

48、权利的限缩，数据使用的良性循环。也需要通过对合理使用的内容做出解释进行调整，引人6结论复制权版权例外条款。进而通过二者的协调作用，整体本文聚焦于创作型人工智能的数据使用行为，根据放入著作权法进行保护。如果认为著作权法第十条现有法律回应创作型人工智能数据使用的法律漏洞问题，所规定的诸多权利都是完整的支配性权利，加人非完整出于对数据时代的发展要求，提出了作者对作品数据使支配性权利可能导致体系的混乱，那么也可以单独添加用行为控制的“数据控制权”，并对这种权利进行了描条款以权益模式进行保护。述，即“在以创作为目的的人工智能数据使用的情形，其二是通过增加涉知识产权的数据保护条例进行保他人必须获得作者许可

49、才能享有对作者作品进行某些数护。在我国的部分地方已经出台了行政法规作为数据立据处理行为的自由，且在获取这种自由后，不得滥用这法的先行试点，对于“数据控制权”的权利或权益的设种自由侵害作者的其他合法权利”。当然，对于这样一种定，也可以先通过行政法规的试点，进入著作权领域进新兴权利而言，在保护作者作为“数据生成者”的利益行保护。的同时，也应对相关权能进行限缩，以保障企业作为需要说明的是，若在作品数据使用上设立这种“作“数据生产者”的利益，使得最终形成的权利，成为一种品数据权”，可能导致许多作者因担心作品侵权，从而拒带有平衡色彩的有限权利。在具体适用方式上，该权利绝作品数据使用，使数据量减少，进而导

50、致数据处理企可以通过立法进人著作权法、进入其他数据法单独条例保护等形式，对作者权益予以保护，并可以通过一系列业蒙受损失的结果。首先，作品数据权并非新生内容，措施，促进数据使用的良性运转。在先行的个人数据研究领域，已经设立了数据使用的知参考文献情权用以保护人格权延伸利益。对于作品数据的使用设【1国务院中共中央国务院关于构建数据基础制度更好发挥立数据控制权亦是类似，是保护主体财产权益目的的延数据要素作用的意见EB/0L（2 0 2 2-12-19）2 0 2 3-续。其次，作品原始数据权属于个人，虽然现有数据法03-24.http:/ 5732695.htm.人享有控制该数据的有限利益。但现有的作

展开阅读全文