生成式人工智能对版权制度的挑战及应对
摘要
人工智能生成物给版权制度带来诸多挑战,主要包括人工智能生成物的可版权性问题、生成表达形式权利归属问题、生成表达形式来源标注问题和由此引发的版权侵权责任问题等。针对诸如此类的问题,各界人士基于版权基础理论提出了必要的应对之策,包括但不限于:判断人工智能生成物之“作品说”与“非作品说”,AI生成表达形式作为作品的版权归属原则和非作品情形下的权利归属原则。本文主张构建以生成式AI生成不同阶段为标准的版权侵权体系,以技术中立性作为生成式AI设计者与所有者的承责要件,遵循过错原则为主、过错推定原则为辅的侵权归责原则。
关键词:生成式AI;生成表达形式;可版权性;权利归属;侵权责任
一、问题提出
2022年10月,OpenAI公司发布的大语言模型人工智能ChatGPT(生成式人工智能)标志着生成式AI(Artificial Intelligence,简称AI,译为人工智能)技术达到新的发展阶段。ChatGPT以生成高质量文本为优势,能够在极短的时间内编写整篇学术论文。2023年1月,外文期刊《实践护理教育》(Nurse Education in Practice)发布以ChatGPT为合作作者的文章,此文章成为ChatGPT生成能力的重要体现,喻意生成式AI打破一般人工智能的技术瓶颈,形成了“AI生成”与“自然人创作”的新形势。伴随着人工智能生成物迅速抢占自然人作品的市场空间,学界开始重新思考人工智能生成物的可版权性、权利归属以及由此引发的版权侵权问题,但尚未达成共识。2023年8月15日,为促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,我国正式施行《生成式人工智能服务管理暂行办法》。略显不足的是,该办法对人工智能生成物的版权问题未予以明确回应,亟须给予必要的关注。面对快速成长的ChatGPT对版权制度带来的影响,本文以版权基础理论为基点,以人工智能生成物的客观问题为导向,以现有实证判例为参考,以人类参与创作的程度为标准,分析不同情境下人工智能生成物对现有版权制度各种可能的挑战,并根据版权基础理论探讨建设性的因应措施,以资求教于同仁。
二、人工智能生成物的可版权性分析
伴随着ChatGPT文本编写能力的日渐增强,学界对人工智能生成物的可版权性问题愈发关注,研究成果精彩纷呈。有学者秉持“机器无意识说”否认机器生成表达形式的可版权性;反之,也有学者以“独创性客观说”予以肯定。无论何种学说,均将人工智能生成物视为统一类型。笔者认为,人工智能生成物是一种新技术带来的成果,其表象具有法律意义上作品的特征,是否具有可版权性,需要秉持客观科学的立场加以分析,基于《著作权法》立法范式,以人类创作贡献为标准实行分类探讨。
(一)否定人工智能生成物的可版权性
1. 基于自然人作者标准的否定
依照我国现行《著作权法》的规定,生成式AI独立生成的表达形式,无论是否符合作品特征,都不可简单推断为作品。追本溯源,我国《著作权法》借鉴大陆法系的作者权体系,秉持“自然人为作者”的基本原则,将作品视为“自然人作者之人格外化”,由此,自然人创作者是作品的构成要件之一。尽管《著作权法》将法人(包括非法人组织)拟制为作者,但自然人仍是作品的现实创作者。ChatGPT被拟人化源于其生成表达形式具备逻辑性与辩证性,据逻辑学专家分析,ChatGPT的辩证逻辑与逻辑学中的辩论术有异曲同工之处。基于此,ChatGPT所谓的“辩证思维”并非机器自我意识的觉醒。换言之,ChatGPT的提供者将辩论术转化为代码注入芯片,利用“数据喂养”代入数字模型运作,使机器产生“类人化”的思维。机械大脑与人类大脑注定存在距离,无法产生自然人作者涵摄的思想与情感,ChatGPT利用算力产生的“主观性”,属于“仿人”却“非人”。笔者认为,ChatGPT通过“自然语言处理”模型的训练使生成式AI自主生成的表达形式,实质是一种“伪创作”,因为ChatGPT“创新能力”是超级算力加持的量变。
2. 基于《著作权法》立法目的的否定
我国《著作权法》立法目的是鼓励创作、传播有益于社会主义精神文明和文化自信的作品,生成式AI独立生成表达形式仅是对现有信息的逻辑组合,是其作为作品受版权保护的主要障碍。一方面,ChatGPT能够无限次生成表达形式,具有高产的特性。倘若认可生成式AI独立生成表达形式的可版权性,不仅严重挤压自然人创作的空间,稀释自然人作品的价值,还与《著作权法》的初衷相背离。另一方面,生成式AI在生成表达形式过程中尚有漏洞,短期内无法解决。据美国新闻可信度评估与研究机构“新闻卫士”(NewsGuard)最新的研究报告显示,ChatGPT-3.5在80%的情况下会产生错误信息,ChatGPT-4不仅传播错误信息,还能增加错误信息的可信度。美国作家布兰科·冈萨雷斯(Blanco·Gonzalez)等撰文指出,ChatGPT生成文本需经过人类编辑后,才能纠正其错误,最终版本必须在人类作者的协助下反复修改才可完成。事实证明,ChatGPT 缺乏信息表达的真实性,由 ChatGPT独立生成表达形式大概率存有错误或误导性信息,失去人类协助,ChatGPT几乎不可能独立生成完整无错的表达形式。综上所述,生成式AI自主独立生成表达形式,虽然具有作品之表象,但不符合《著作权法》关于作品的基础理论,因此不具有可版权性。
(二)肯定人机协同生成表达形式的可版权性
1. 基于思想表达二分法的肯定
思想表达二分法是版权基础理论。基于该理论, 缺乏一定思想内容的表达形式不能成为作品,纯粹的思想内容同样不受版权保护。生成式AI不存在自主思想与情感,生成式AI独立生成表达形式自然无法满足思想表达二分法的要求。以人类贡献程度为标准,人机协同创作可进一步划分为AI辅助人类生成和人类输入关键词提示AI生成两种类型。第一种类型,生成式AI辅助人类生成的表达形式能够实现思想与表达的兼容并存。生成式AI固然缺乏思想,但生成式AI辅助生成的表达形式是凝聚自然人创作者的创作思想,生成式AI仅分工协作完成外在表达即可。第二种类型,人类输入关键词提示下生成式AI自主生成表达形式,是否符合思想表达二分法,取决于表达形式是否蕴含自然人思想。笔者认为,自然人输入关键词蕴含生成式AI生成过程的总体导向,本质而言,生成式AI生成逻辑未脱离自然人思想范畴。综上,无论是生成式AI辅助人类生成表达形式,抑或是人类输入关键词提示AI生成表达形式,都是依照自然人创作者的思想生成表达形式,区别仅是人类参与创作程度的高低,但均在思想表达二分法的范畴之内。
2. 基于作品独创性要件的肯定
在符合思想表达二分法的前提下,仍需判断人机协同生成表达形式是否满足作品独创性要件。独创性着重强调具体的表达形式是否为创作者独立完成之情形,主要表现为创作者独立运用其智慧、能力和技巧,表达其某种感受、观点、思想等。一方面,人机协同生成表达形式的过程相对独立。生成式AI能够自主完成模型生成、挖掘数据与自我优化,相较于一般人工智能,更具灵活性与主动性。不仅如此,生成式AI模型会持续学习创建训练数据集的规则,通过随机采样确保每次执行任务都可以创建不同对象。另一方面,人机协同生成表达形式可以达到最低程度的创造性。对第一种类型而言,人类贡献仅限于输入关键词,生成式AI生成的表达形式符合“客观可识别的差异”即可。在2020年高阳诉优酷著作权侵权纠纷案中,我国法院认为运动摄像机的预选录像模式、灵敏度和其他参数反映了人为干预,因此拍摄图片视为摄影作品获得保护。不可否认,人类贡献程度较低并不影响人工智能生成物的创造性。第二种类型,生成式AI辅助人类生成表达形式具有创造性。我国已有相关案例论证,2019年腾讯公司诉上海某公司著作权侵权纠纷案中,法院将智能写作辅助系统Dreamwriter的生成文本视为具有独创性的文字作品。除此以外,ChatGPT辅助生成论文在国外期刊上公开发表,同样论证生成式AI辅助生成文本已符合创造性标准。
三、人工智能生成物的分类探讨
ChatGPT的出现提高了AI生成表达形式的质量门槛,也逐步提升了人工智能生成物的文化与经济价值,致使人工智能生成物的权利归属问题日渐复杂。据上文所述,人工智能生成物的两种类别并非全部符合可版权性,由此推断,人工智能生成物同样存在“作品”与“非作品”之分。因此,固守“统一认定”的方式实非明智之举,必然导致人工智能生成物留存空白之处无法涉及,依据类别逐一分析才能由简至深,面面俱到。
(一)人工智能生成物作为作品的版权归属
1. 既有理论的不足
人工智能生成物作为作品的版权归属问题在学界评论纷然,这些学说各有其理,难分伯仲。然而AI技术日新月异已导致传统学说呈现不足之处。具体如下:第一,职务作品说。该学说否定AI作者身份,将AI生成的表达形式视为职务作品归属于AI设计者或所有者。职务作品说呈现的不足,根本在于技术背景的差异性。职务作品说产生于AI依靠固定模型的初级阶段,AI仅能输出设计者预设范围之内的表达形式,AI生成表达形式被视为设计者的意志。众所周知,生成式AI具备自主学习与模型生成的特性,输出表达形式已突破设计者的预设范围,设计者只能影响技术中立性,却不能固定生成式 AI具体生成的表达形式。第二,法人作品说。该学说认为AI是由AI所有者组织,并代表AI所有者的意志生成表达形式,将AI生成表达形式归属AI所有者。生成式AI的使用者与所有者可以是同一主体,抑或不同主体。倘若非同一主体,法人作品说则会忽略使用者的合法权益。第三,孳息说。孳息说视生成式AI为原物,其生成表达形式属于原物的孳息,归生成式AI的硬件所有者。孳息属于原物天然性能下的产物,生成式AI独立生成表达形式符合孳息特性,但人机协同生成的表达形式,无法脱离人类辅助。由此,孳息说亦存在无法涵盖之处。
2. 遵循意思自治为主、支付报酬为辅的标准
人工智能生成物的版权归属涉及生成式AI所有者、设计者与使用者三方主体,如何兼顾三方主体的合法权益,是探讨权属问题的关键所在。笔者认为,要以生成式AI生成过程的客观事实搭建对三方主体的认知,即分析不同主体在生成过程中的角色与作用,才能脱虚向实,做到有效兼顾。2023年3月,OpenAI公司发布ChatGPT使用协议,该协议说明OpenAI公司将所有人工智能生成物的所有权利、所有权和利益均转让给用户所有,用户可用于任何目的且对生成表达形式负责,但用户需要按照定价页面上的价格支付所有的费用以及相关购买的税费。同年,智能画图工具 Midjourney 将用户创建的图像所有权利归于付费用户,非付费用户只拥有非商业目的的全部或部分复制材料或制作、复制和共享改编材料的权利。综上案例,用户获得人工智能生成物的所有权利是通过付酬的等价交换,AI使用者与所有者达成利益平衡。
人工智能生成物权利归属还有一种学说——委托作品说,与现行生成式AI公司的使用协议有相似性和差异性。相似性是两者之间都遵从意思自治原则,差异有两处:第一,委托作品一般由委托人主动约定权属归自己所有,而使用协议属于生成式AI公司的主动协商,且权属归于用户所有。第二,无约定之情形,委托作品的版权归属受托人所有,生成式AI的生成表达尚无定论。
现实中,如何认定双方无约定下人工智能生成物的权利归属,关键是使用者是否支付相关合理费用。如果支付合理费用,使用者完成利益交换,取得人工智能生成物的版权;反之,归属于生成式AI的设计者或所有者,设计者与所有者可通过职务作品、法人作品、委托作品等进一步探讨版权最终归属。
(二)人工智能生成物作为非作品的权利归属
1. 生成式AI以生成者身份进行标注
生成式AI不能获得作者的身份,已得到许多国家和地区的认同。美国版权局在《美国版权局实务指南》中表示其不会登记任何没有自然人作者贡献而单纯由机器产生的作品。欧洲法院在具有里程碑意义的一项裁决中认为,原创性是作者的智力创造,人类作者是版权作品存在的先决条件。生成式AI不能成为作者,自然没有署名权,但由生成式AI 提供者或生成式AI使用者署名显然不妥。即便自然人成为生成式AI的承责主体,也不代表自然人具有署名权。对此,乌克兰在人工智能生成表达形式的归属问题上提出,生成式AI可以生成者身份在生成表达形式上进行“标注”。需要注意的是,标注不等同于署名,即不产生作者身份的法律意义。“标注”仅表示该生成表达形式是由生成式AI自主生成,产生标识性意义,同时防止被他人盗用。2023年8月7日,我国信息安全标准化技术委员会秘书处发布《生成式人工智能服务内容标识要求(征求意见稿)》, 要求生成式人工智能需要标识其表达形式,包含显示水印标识、隐式水印标识以及“由AI生成”等标识方式和信息。总之,我国提出的“由AI生成”的标识信息和乌克兰提出的“标注”具有表示生成式AI生成身份的最终目的,只是“标注”更具直接性。
2. 依据投资原则归属生成式AI所有者
依据投资原则判断生成式AI独立生成表达形式的归属具有合理性。生成式AI独立生成表达形式即使不属于作品,也并非一定属于公有领域,其可能作为无形财产成为《民法典》保护的对象。吴汉东教授曾提出“无形财产权”的概念,无形财产权大于知识产权的理论制度体系,基本上将各类无形财产或无形财产权囊括其中。财产权是一种直接与经济利益相联系的民事权利,当生成式AI独立生成表达形式属于无形财产,以投资原则判断其权利归属更为贴切。原因如下,不论是生成式AI辅助生成表达形式,还是人类输入提示词生成表达形式,表达形式与使用者之间均存在直接联系。同理,生成式AI 独立生成表达形式时,生成式AI的相关主体与表达形式之间亦存在直接关系——投资与被投资关系。
依据投资原则,生成式AI独立生成表达形式与生成式AI所有者之间具有直接联系。首先,确定具有直接联系的投资主体。通常情况下,生成式AI的设计者与所有者是同一主体,生成式AI的投资者不言而喻。特殊情形下,两者并非同一主体,生成式AI机器所有者通过购买途径获取机器所有权,设计者则通过销售报酬获取既得利益,机器所有者成为生成式AI的直接联系者。其次,平衡设计者与所有者之间的投资利益。倘若两者属于雇佣关系,则依据《专利法》职务发明创造的规定判定生成式AI软件的专利权归属,属于职务发明创造,则由单位通过奖励或报酬平衡设计者利益。当两者属于普通关系,机器所有者可通过买卖合同获取软件所有权,完成投资利益的平等交互。综上,基于投资原则的分析,生成式AI自主生成表达形式应当归于生成式AI机器所有者。
四、人工智能生成物的侵权认定与归责
人工智能生成物的过程具有阶段性,主要包含数据训练与具体形式生成两个阶段,而在上述阶段频繁产生的版权侵权问题亟须关注。在学术界,有学者提出,人工智能生成物的版权侵权行为应当统一认定;也有学者否认AI生成过程的统一性,提出对复制行为与生成行为分别评价。笔者认为,以生成式AI的技术原理为视角,生成式AI具体形式的生成过程是两种相对独立的技术行为,证明数据训练与具体形式生成阶段理应各自分析。
(一)生成式AI数据训练阶段的侵权认定与豁免
1. 生成式AI数据挖掘的侵权认定现状
数据训练,是用以训练机器模型或算法标注数据的方法,是通过量化数据中的最优参数,提升机器模型完成任务质量与效率的技术。数据训练促进收集数据集与生成表达形式在技术与实践中的深度连接。数据挖掘行为是数据训练的重要环节之一,该行为是否侵犯版权,学界对此素有争议。争议焦点集中在“若数据挖掘行为属于合理使用,是否限制其盈利目的”,由此,存在“非营利目的说”与“营利目的说”。针对该问题,各国亦采取不同的应对之策。欧盟在2019年《数字化单一市场版权指令》中新增文本数据挖掘为目的的商业性TDM例外。此外,虽然美国对近期发生的生成式AI著作权侵权案——Getty Images v. Stable AI案尚未判决,但是美国早已存在相关判例。在早期谷歌数字图书馆著作权侵权案中,美国法院采用合理使用四要素标准分析数字图书馆的数据挖掘行为,以符合转换性为由判定数据挖掘行为构成合理使用。相比于美国,英国未采用灵活的判断标准,而是在《版权、外观设计和专利法》第29条第A款规定数据挖掘版权例外规则,只是将商业用途的数据挖掘行为排除在外。
2. 生成式AI数据挖掘行为的侵权豁免
我国目前尚未明确界定生成式AI数据挖掘行为,笔者认为,我国应当借鉴欧盟立法确认生成式AI数据挖掘行为的合理性。理由如下:首先,符合《著作权法》利益平衡原则。当下市场中生成式AI提供者以营利性组织为主,例如OpenAI公司。假设以生成式AI提供者营利为由否认其数据挖掘行为的合法性,极易造成技术发展的阻碍,反之,又会诱发生成式AI提供者的数据垄断风险。为解决上述问题,欧盟在商业性TDM例外条款中设置一项特殊机制,即选择退出机制。该机制赋予著作权人选择退出数据训练的权利,借此降低生成式AI提供者数据垄断的风险,同时保障著作权人的合法权利。其次,实现利益合理分配。数据训练需要庞大的数据集,而数据集的质量决定生成式AI的输出质量,因此,公共领域的数据不足以达到生成式AI提供者的质量需求。我国《著作权法》采用选择进入制度,即未经授权使用著作权人作品属于侵权行为。假设生成式AI提供者适用选择进入制度,其收集《著作权法》保护的数据必须经过著作权人授权,显而易见,生成式AI提供者无法负荷巨大的授权成本。最后,引入商业性TDM例外属于技术与版权协调的必然趋势。技术变革促进版权制度的调适与重构,从早期的互联网上传、搜索引擎、深度学习再到AI数据训练,《著作权法》的修改始终是对技术更新的回应。当选择进入制度成为生成式AI发展的阻力,我国《著作权法》应立即采取措施适应技术变革,促进创新与科学文化技术的发展。
(二)生成式AI具体形式生成阶段的侵权认定与责任
1. 人工智能生成物的侵权认定
人工智能生成物的技术特性时刻提醒学界需重新审视由此引发的版权侵权风险,主要集中于著作财产权。首先,复制权。生成式AI在具体形式生成阶段,面临人工智能生成物“复制”版权作品的侵权风险。众所周知,我国《著作权法》以“实质性相似+接触”作为侵权认定的基础规则。人工智能生成物有两种侵权风险:一种是同一AI生成两种答案相同或近似的表达形式;另一种是人工智能生成物与输入著作权作品构成相似性或同一性。针对第一种行为,OpenAI公司的使用协议中说明:“其他用户请求与生成表达形式不被视为用户的生成表达形式”,以此说明用户各自拥有生成表达形式的版权。人工智能生成物只要具备客观可识别的差异,则均受《著作权法》的保护。如果表达形式完全相同,则需考虑人类贡献是否仅限于关键词提示,并依据“前一作品公之于众 + 明显相似”的原则进一步判定。其次,改编权与汇编权。人工智能生成物是以《著作权法》保护的作品为基础而创作的新作品,则需要依据《著作权法》的规定取得著作权人的授权许可,同理,生成式AI未经著作权人许可,将他人作品或作品的片段编入其汇编作品的行为,亦构成侵权。最后,传播权。使用者对人工智能生成物的后续传播行为,可能涉及对作品著作权人的表演权、放映权、广播权和信息网络传播权的侵犯。
2. 人工智能生成物的侵权责任承担
生成式AI的技术中立性决定生成式AI提供者和设计者是否承担侵权责任。生成式AI的技术中立性是生成式AI提供者是否中立的判断标准,生成式AI的技术中立性的探讨需回归技术本身。首先,需要判断生成式AI是否存在算法黑箱和数字鸿沟,导致人工智能生成物存在虚假、偏见等。只要生成式AI提供者和设计者设定数据,且未曾对系统做正向引导,就能判定人工智能生成物的错误属于生成式AI提供者和设计者的过错。其次,需要判断生成式AI的提供者和设计者是否对其进行实质性干预,只要未实质性干预生成式AI的生成过程,那么生成式AI平台的中立性就不会被打破。最后,需要判断生成式提供者和设计者是否履行透明度和内容审核等注意义务。欧盟《人工智能法案》第28b条第5a款规定生成式人工智能提供者须遵守的透明度义务,以及AI设计与开发时的内容审核义务。我国《生成式人工智能服务管理办法》第4条至第7条同样规定提供生成式人工智能服务商需遵循合法性审核、尊重公序良俗等义务。
生成式AI的使用者应适用过错原则为主,过错推定原则为辅的归责原则。我国知识产权法适用过错原则为主,过错推定原则为辅的归责原则,过错推定原则有助于制裁虽无主观过错但缺乏抗辩事由的侵权行为人。生成式AI的使用者对生成式AI的使用程度不同,其适用的归责原则不同。当生成式AI的使用者对生成式AI的管控能力较小,例如自然人输入关键词,生成式AI的自主性较强,此时适用过错原则能够减轻被侵权人的举证难度,具有合理性。当生成式AI的使用者具有直接管理生成式AI的能力,例如生成式AI辅助人类创作,能够对人工智能生成物进行审核、检查,确保真实性与创造性,此时适用过错推定原则可以达到减轻被侵权人的举证压力,保障被侵权人的合法权益的目的。
五、结论
习近平总书记强调,“国家科技创新力的根本源泉在于人。”自然人是创新的根本,科技是发展的利器,要以法律责任守住科技底线。生成式AI技术在知识产权领域、出版领域、金融领域等掀起热潮,然而,生成式AI在社会的定位应始终坚持自然人本位的基本原则。生成式AI在未来会继续突破技术瓶颈,人工智能生成物的版权保护会愈加复杂,我们不可能完全排除生成式AI在未来会从“类人”变为“机器人”,也不可能完全排除人工智能生成物的可版权性。至少在当前,此种设想还尚未实现。
-
上一篇:
-
下一篇:
- 生成式人工智能机器学习的版权争议及应对
- Ed Sheeran在《自言自语》歌曲的版权上诉中胜诉
- 国家版权局公布第一批版权强国建设典型案例
- 《银翼杀手2049》制片人就人工智能图像起诉特斯拉和华纳兄弟
- 英国:版权与人工智能的对峙将在数月内结束