人工智能与版权
——法律涵摄技术的路径选择
摘要
生成式人工智能的普及,使普通网络用户得以通过输入提示语的方式来进行创作,形成了“用户创造内容”与“人工智能生成内容”叠加的趋势,也再次引发了人工智能生成内容的可版权性与版权归属之争。回顾版权制度史可以发现,无论是机器介入、计算机介入还是人工智能介入,百余年来人类与作品独创性的关联性论证,始终围绕“构想”和“实施”两个要件展开。鉴于设计者从人工智能核心代码、训练数据来源和偏好,以及自身发展方向来把控“构想”,应该将人工智能的设计者视为作者。在使用者仅以提示方式生成作品的情况下,人工智能设计者与使用者之间的关系应纳入委托作品的范围,使用者作为委托人,依据“最终用户服务协议”取得所生成作品版权。如果所生成内容中包含训练数据中他人作品的独创性元素,设计者则应在合同中将该内容限定于非商业性使用。
关键词:人工智能内容;计算机生成内容;独创性;涵摄
一、问题的提出
进入21世纪后,得益于计算机运算能力和大数据技术的快速提升,人工智能借助数据驱动的机器学习已经取得重要突破,从而得以在更为广泛的领域被适用。如果说2016年来自谷歌的深脑公司(DeepMind)的人工智能阿尔法狗(AlphaGo)战胜人类顶级围棋棋手带来的认知冲击还限于特定智力竞技领域,那么从2022年开始,以OpenAI的ChatGPT和谷歌公司的Bard等为代表的生成式人工智能(Generative Artificial Intelligence),则已经能够在文字、绘画和软件等领域以达到普通人的水准完成文本生成,也标志着人类社会进入了继个人电脑和互联网之后信息时代的第三次飞跃期。生成式人工智能的特点,不再如传统搜索引擎一般为用户提供尽可能准确的知识来源,而是以论证的方式回应用户要求并生成新的内容。更为重要的是,用户利用人工智能进行内容生成只需要通过输入自然语言即可完成,这种近似对话和搜索的使用方式,极大降低了使用门槛,使得普通人能够借助生成式人工智能获得创作各种类型作品的能力。生成式人工智能中最受关注的ChatGPT上线两个月后用户数就已突破1亿,成为历史上用户数增长最快的应用软件,其根据用户发出的提示来协助完成的各类作品已经充斥网络。
生成式人工智能的普及,在版权领域再度引发两类问题的讨论:一为人工智能生成的内容是否属于作品并受《著作权法》的保护;二为如果该内容属于作品,应如何认定其归属。与技术上的日新月异不同,全球版权立法在经历了从机器介入内容生成到人工智能生成内容的漫长历史后,关于人类与独创性来源的立场却始终如一。从源起于19世纪末摄影设备介入创作后首次出现的机器与创作关联性之争,到20世纪末“计算机生成作品”(Computer Generated Works)权利归属的成文法定义,再到今天针对人工智能生成内容的版权认定,司法机关、行政机关和学界的主流判断,都坚持只有人类才能拥有作者身份,无论是机器、计算机还是人工智能,都不得视为作者。借助机器且以随机或自动运行的机械过程所生成的内容,因为其中缺乏人类智力活动的参与,该内容也不得被视为作品。而且现有《著作权法》也足以应对来自人工智能生成内容的挑战,无须专门设计全新的制度来解决问题。在司法实践中,我国法院也明确认可了人类创作在人工智能生成内容可版权性认定中的必要性。但当人工智能生成内容与他人作品构成实质性相似时,侵权行为的归责又必须追溯到侵权作品的主体。这种技术进步与规范守成之间的差异,以及拒绝保护和确权需求之间的悖论,都需要我们再次审视现有规则及其解释路径,探寻兼具符合版权立法目标和满足技术迭代需求的权利配置安排。但从机器介入创作的技术史与制度史中已经可以发现,《著作权法》之所以坚持以既有的客体判定和权利归属传统来涵摄机器与创作的关系,目的始终是激励人在作品创作和传播中的核心作用,并在权利归属的认定上确保法律关系的稳定性。因此,以既有的独创性标准认定人工智能生成内容的可版权性,并正确区分该作品在人工智能算法设计者和使用者之间的权利归属,前提都在于认定人与创作行为的关联性。
有鉴于此,与技术领域所追求的及时创新不同,人工智能生成内容版权确权的科学性依据需要从历史中探寻。首先,只有通过梳理世界范式下的《著作权法》在司法实践中涵摄机器与创作关系的历史,方能正确理解《著作权法》为何始终强调自然人的智慧在作品形成中的不可替代性,以及为何以既有的权利归属规则来涵盖人工智能的设计者和使用者。其次,对人工智能生成内容在法定和意定两个层面明确权利配置安排,不但关系到权利归属的厘清是否能够反哺作品创作与传播,使人工智能的介入不会影响文化与科学领域的创新,更涉及人工智能生成内容在权利变动过程中各方利益和责任的明晰。
二、《著作权法》涵摄机器介入创作的历史与立场
关于人工智能生成内容给《著作权法》带来的挑战,可回溯到20世纪计算机的普及。早有学者20世纪90年代预言,计算机与版权冲突的核心将会体现在计算机生成作品这个问题上。针对这一问题,同一时期的主流研究者则始终坚持自《伯尔尼公约》延续而来的传统解释,即只有自然人才能具备作者身份。在真正进入人工智能时代,特别是通用人工智能兴起后,这样的论断虽然遭遇了越来越多挑战,但收到的回应仍然是对既有作品可版权性判定传统的坚持,即作品的独创性中必须体现人的贡献。事实上,人工智能对《著作权法》的挑战,可以视为机器介入创作的历史延续。虽然机器介入、计算机介入和人工智能介入的程度和方式存在差异,但全球范围内的版权法制及相关司法实践,都无一例外坚持了自然人才能具备作者身份的立场。这种自《伯尔尼公约》以来即围绕人来构建的作者体系,并未因为在创作中不断加入机器的因素而得到改变,所以相比科学界和媒体热闹非凡的讨论,法律界对人工智能生成内容的应对显得更为冷静和一以贯之,在司法裁判和版权管理上,人工智能被视为作者的尝试始终没有获得认可,由自然人创作完成仍应是作品可版权性的必要条件。
《著作权法》历史上首先遭遇机器介入的挑战,来自摄影设备在摄影作品创作过程中所起作用的讨论。由于摄影设备取代了摄影师之手来实现作品在载体上的呈现和固定,机器是否承担了一部分的创作在当时成为讨论的焦点。当时,对于作品独创性的判定标准中,有观点认为,应该将创意的实施和执行纳入作者创作行为的考量,法律不应保护未经实施的创意。换言之,版权的取得,需要将构想通过具体实施加以展现。作者不能仅仅贡献创意,更要将创意具体化方可视为实施了创作行为。针对摄影设备的使用,法院则认为,虽然摄影设备在拍摄摄影作品过程中可以部分替代手工操作,但拍摄光线、角度等要素的选择,仍然是摄影师创意的体现。因此,即使创意部分的劳动因机器的替代而与固定创意的劳动相区分,但只要作者能够预见和决定生成的结果,即可视为构成创作。
在针对摄影作品中创作行为认定的判例中,法院已初步形成了通过两个必要条件来考量作品独创性与创作行为的关联:一为“构想”(conception),即创作者首先形成具象化的创意,构建作品可辨识的元素和风格等,属于创作中的构成智力创造的精神活动部分,也是在后期作品成型后判定其是否具有独创性的基础;二为“实施”(execution),即创作者将“构想”具体化于表达的过程,包括但不限于以文字、画面或旋律等方式展现不同类型的独创性表达,属于将创作最终固定的环节。在逻辑关系上,“构想”必须实际实施方能视为创作的完成,任何一个环节的缺失,即会视为不构成创作行为。针对机器设备的介入,法院则认为机器参与的仅仅是“实施”的那一部分,而无法代替人类完成“构想”。而且对于“实施”而言,机器设备的使用并不意味着人类的实施行为被取代,而是作为人类的辅助性工具,完成机械性的劳动。这种辅助性的认定,是基于创作者对实施结果的控制力。换言之,创作者只要对创作结果具有预见性和可控性,机器在实施环节的介入则不影响作者身份的确认。
随着技术的日益复杂,机器介入创作的争议再次集中出现在20世纪80年代的计算机生成内容上。与早期类似摄影设备那种由人全程操纵参与创作行为的机器不同,计算机生成内容中的“生成”,意指由软件自行决定表达内容的特色和风格。具言之,计算机生成内容的特殊性体现在两个方面:第一,计算机软件设计完成后,该程序即可自行实施内容生成,软件设计者不再直接参与其中。这一特征意味着计算机生成不同于以办公软件和绘图软件为代表的计算机辅助,在前者中内容的生成是计算机软件独立运行的结果,而在后者中计算机对人类而言只具有工具性意义,其本质功能等同于画笔或其他辅助创作的机械设备。第二,软件使用者的使用行为可能对计算机生成内容的结果造成影响。计算机并不会主动生成内容,而是需要使用者输入指令来激活。例如,在电脑游戏画面的生成上,电脑游戏玩家虽然没有直接决定具体画面的内容,但其操作的不同会使游戏软件生成不同画面。
针对这一现象,1988年英国在《版权、外观设计和专利法》(Copyright,Designs and Patents Act 1988)中增加了一条“计算机生成作品”,专指在没有人类介入的情形下通过运行计算机软件所生成的作品,也仍然把该类作品的作者认定为实施必要操作使作品得以生成的自然人。这一立法亦象征着机器介入创作的方式从机械的辅助性工具提升成能够自动生成的独立设备。但即使如此,在涉及“计算机生成作品”的判例中,“实施必要操作的人”被认定为计算机软件的设计者,因为计算机生成的内容乃是来自计算机软件的预先设定。换言之,“完全由计算机生成的作品”仍然被解释为软件设计者通过程序实施预设的结果。虽然计算机所生成的内容极为多元和多变,但生成的规则和逻辑必然受原程序的局限,所以作品的构思应归于计算机软件的设计者。
在涉及计算机生成内容构成画面或图形,特别是电脑游戏画面的权利归属问题上,有观点认为,电子游戏运行中呈现出来的视听画面是基于玩家的操作生成,而并非游戏软件设计者所能预期或控制的结果,因此游戏软件设计者不得对该画面主张版权。之所以有此判断,原因在于该观点认为游戏画面所呈现出来的结果并非软件设计者“实施”的结果,而且由于游戏每次运行时呈现的画面并不相同,软件设计者对画面缺乏可控性,无法满足判定创作行为来源的“构想”和“实施”两个要件。但法院却指出,游戏玩家(软件使用者)的操作行为并非创作,而是对游戏软件中已储存画面的选择,类似于对不同频道电视画面的选择,其对作品的独创性没有任何智力或劳动上的贡献,不应视为作者。基于法院的认知,游戏玩家的操作行为并非对“构想”的“实施”行为,所有操作所呈现出来的画面,已经在游戏软件中存在,软件设计者仍然保有对呈现结果的预见性,这种可预见性就成为认定软件设计者能够保证实施结果可控的标准。
由上可见,从摄影设备到计算机软件介入作品创作,技术手段显然不可同日而语,但在《著作权法》的适用上,人类对作品生成的智力贡献永远都是重点。域外优先立法和做出审判的国家,一直以是否独立形成构想,以及是否能够预期实施创作的结果为标准来确定作者身份。随着机器介入程度的不断提升,法院对构想和实施的解释也呈现出新的变化,在解释何谓“构想”时,不要求创作者必须先形成一个完整且准确的表达,在解释何谓“实施”时,也强调不要求对结果有完全的控制力,而是以可预期为标准来认定作者对实施结果的把控。这种以构想和实施来涵摄机器介入创作时作品独创性来源的判断要件,既保持了判定标准的稳定性,又灵活地将独创性来源与自然人对应,坚持将机器视为人类创作的辅助工具这一核心判断。
三、涵摄能否延续:人工智能生成内容的特点与版权认定
生成式人工智能的广泛运用,带来了明显不同于以往计算机生成内容的特点。如前所述,无论是立法上还是判例中,对计算机生成内容的认知都是“通过操作软件实现的稳定输出,程序设计者对该结果是可预见的”,因此所生成内容并未超出计算机软件设计者的预期。但生成式人工智能的突出特点,就在于其具备了深度学习的能力,使计算机得以基于对海量数据的分类和整理而从中提炼出所学习数据的典型特征和表达风格,最终在上述数据所构建的场景中生成类似特征和风格的新内容,并由此脱离原程序的设定。以现今引起广泛讨论的文本生成、图像生成和视频生成人工智能为例,用户仅需要以“提示”的方式输入其所需内容的描述和要求,人工智能就会自动调用其通过深度学习获得的数据,再经过多次调整和修正后生成与用户描述尽可能接近的内容。以图像生成人工智能软件Midjourney和文本生成人工智能软件ChatGPT为例,两者生成内容的方式,都是使用者首先输入一段描述所需内容的提示文本,待人工智能根据提示输出一项或多项内容后,使用者基于已生成的内容调整提示文本,以引导人工智能生成新的内容,如此反复直到使用者获得满意的结果。
具言之,人工智能生成内容的整个实现过程,可归纳为三个必要阶段,先后分别是人工智能算法设计,机器学习和内容生成。在三个阶段中,仅有第一阶段完全由人类以程序设计者的身份完成人工智能的算法模型,而且该算法模型已经借助计算机软件的方式在《著作权法》中得到承认和保护。第二阶段的机器学习,人工智能就已经可以通过对海量同类型数据进行分析来找到其中的共性特征和风格,人类仅在为训练人工智能模型而提供数据时,通过数据标注和评分机制提升生成内容质量和准确性时参与其中。到最后第三阶段的内容生成,人工智能就直接以用户的简要提示为指导,再基于对海量同类型数据分析中获取的共性特征和元素来生成新的内容。很显然,在第二和第三阶段,人工智能的设计者和使用者都只能看到输入的数据和输出的内容,但无法直接理解生成的过程中人工智能如何进行具体选择和取舍,导致该过程成为一个“黑箱”。因此,比起建立在完全执行程序设计基础上的计算机生成内容,人工智能生成内容与程序既定设计之间的关联性更为疏远,程序设计者无法解释算法黑箱中产生的内容。人类在创作时从抽象到具体的构思和从无到有的实施过程,被人工智能算法以文本与图像之间的关联规律所替代。也正因为如此,有观点即认为由于人对创作过程丧失了控制力,人工智能生成内容就不应被视为作品。
美国版权局在2023年撤销以人工智能生成漫画版权登记的一封回复函中就明确指出,用户用提示语的方式引导图像生成人工智能软件Midjourney生成的18页漫画不具有可版权性,因为图像生成过程中缺乏人的创作,而是由Midjourney随机生成。没有作者参与创作的原因是作者对生成的结果不可预期。但美国版权局又同时认为,如果艺术家能够把控这种图像生成工具的实施过程,即可享有所生成图像的版权。在2023年3月颁布的《人工智能参与生成作品的版权登记指南》中,美国版权局再次强调,以收到“提示”的方式生成内容,由于使用者缺乏对创作实施阶段的把控,凸显独创性的具体构思都是由人工智能所选择和决定,所以该内容不应被视为作品。换言之,上述判定标准仍然延续了19世纪末机器首次介入创作时以“构想”和“实施”作为创作行为来源的思路。我国法院对人工智能生成内容可版权性的判断,同样将人类创作与作品独创性的关联作为认定依据,一方面仍然以传统的作品构成要件来判断人工智能生成内容的可版权性;另一方面同样强调人在作品独创性中的贡献。由此可见,司法机关和行政机关迄今为止对人工智能生成内容可版权性的认定,仍集中于创作是否来源于自然人。但在裁判结果上,由于生成式人工智能技术的迭代,自2018年开始美国就已陆续出现不保护以提示方式生成内容版权的裁决,这说明自然人在如今的生成式人工智能中更加难以与创作相关联,仍然是回归对独创性来源的判断。之所以延续百余年来以作品独创性与人的关联来涵摄人工智能生成内容的传统,而不考虑进行立法论上的创新,主要原因在于两点:
第一,从规范层面出发,在人工智能生成内容的可版权性认定中坚持自然人对独创性的贡献,是维持确权和侵权体系稳定的需要。作品作为《著作权法》中的核心概念,其必须来源于人的创作一直是应有之义。虽然《伯尔尼公约》没有对何谓作者加以明确界定,但从体系解释的角度出发,人作为作者也在关于收益对象和精神权利等大量条款中得到确认。所以即使是非大陆法系国家,非自然人也是以“视为作者”的拟制方式被认定为更需要激励且行使权利更有效率的主体。各国《著作权法》及历史上的相关典型判例,也始终将人对独创性的贡献视为客体认定的必要前提。正因为如此,无论是现在的人工智能生成内容还是计算机生成内容,都因为缺乏人的创作而不被认为是作品。之所以坚持以既有规范涵摄对人工智能生成内容的可版权性判断,从法教义学的角度看主要是为了保障版权法基本功能的实现。在客体认定上,如果因为内容来源于人工智能就采取差异化的判定标准,甚至将其排除在作品范畴之外,只会导致法律适用的混乱。当同一作品会因来源于人工智能还是人而存在是否受《著作权法》保护的差异时,就会出现大量以署名的方式宣称自己是该作品的作者,以规避《著作权法》对人工智能生成内容的排除,司法实践中不得不耗费大量资源去认定该内容是否来源于人工智能,以此确定能否将该内容视为作品。另外,由于人工智能在深度学习和内容生成过程中会大量借鉴已有的同类作品,一旦生成内容与训练所输入的内容出现实质性相似,原作品权利人将因为人工智能生成内容被归入公共领域而无法向任何人追责,大规模内容生成反而遮盖了大规模侵权的现实。因此,人工智能技术虽然有着突飞猛进的发展,但其生成内容与人类创作行为相关联的需求,则因实践中确权和侵权认定的需要而不可动摇。
第二,从效用层面出发,人工智能生成内容并未完全解决版权市场失灵问题,赋权相关主体仍然是激励创作和传播的有效手段。对人工智能在生成内容问题上的独立判断,不符合《著作权法》的立法目标。自现代《著作权法》产生以来,其立法目标始终是通过赋权来激励人对作品创作和传播,但对于人工智能生成内容是否还需要激励这一问题,学界已有不同观点。首先,人工智能生成内容的常态化,意味着普通网络用户都能通过该渠道来进行创作,形成了“用户创造内容”(UGC)与“人工智能生成内容”(AIGC)叠加的社会现象。本来“用户创造内容”就已经因为内容生成门槛的降低而造成网络上同质化内容数量激增;生成式人工智能的普及,进一步降低了创作门槛,使得内容不再是稀缺资源。既然不再稀缺,作为赋权正当性前提所预设的版权市场失灵也就得到了缓解,是否仍应通过赋权来激励创作和传播就需要重新考量。更有学者认为,如果一视同仁地将人工智能生成内容视为作品,将破坏《著作权法》所构建的激励机制,鼓励更多的人工智能而非人来完成创作。既然对人工智能设计者的激励已通过赋予其软件版权来实现,就无须进行重复激励。但需要注意的是,海量作品的存在自“用户创造内容”普及甚至互联网时代到来后就已成为常态,并非因为生成式人工智能的广泛适用。同时,内容数量的增加并不是不存在市场失灵的理由。激励的功能不仅仅是实现作品从无到有的转变,更重要的意义还在于提升创作和传播质量,以及弥补因传播技术转换而导致的传统版权市场失灵。在版权制度变革的历史中,每当作品借助新兴传播技术形成新版权市场时,《著作权法》基本都以赋权方式涵盖新的传播渠道来保证激励的延续性,以新的收益渠道来弥补因传播渠道的替代所导致的传统市场的萎缩。由于生成内容的质量取决于人工智能算法和训练的质量,更与训练输入的内容质量相关,这种激励机制的转移也意味着持续鼓励对硬件和训练数据的投资以及对算法的改进。
既然继续以涵摄的方式去说明自然人是否对人工智能生成内容存在独创性贡献,就仍要回到人工智能生成内容三个阶段中是否包含了人对“构想”和“实施”的贡献这个基础逻辑上。事实上,正如创作摄影作品和视听作品时无须要求创作者理解摄影设备内部运作原理一样,人工智能的设计者或使用者亦无须知晓被训练后的人工智能如何通过数据之间关联生成新的内容。深度学习之所以能够赋予机器以智能化,原因在于其能够通过已输入的训练数据和样本去寻找和确定数据中的规律和范式,由此优化形成一个新的模型来探索解决特定问题的新路径,使人工智能获得了对新数据进行分类和整合的能力。换言之,人工智能并非如自然人一般去理解语言或图形的含义,而是通过对海量数据的学习来发现其中的规律,并以此生成内容。其中探寻规律和范式的方法,则仍然是由人工智能的设计者所决定。深度学习阶段是人工智能能够生成内容的前提,但人工智能的学习和分析方式与人类截然不同。人工智能并非如人类一般通过语法和词义来理解被输入的数据,而是把词语在训练中出现的概率和训练者的评价作为标准。在此过程中,人工智能对输出数据的评价,其实是学习人类评估输出数据质量的结果所形成的一个反馈模型。人工智能的设计者和训练者如何选择数据样本范围以及如何对算法反馈结果进行标注,事实上决定了人工智能生成内容的方式和范围,最终来判断反馈结果好坏的,仍然只能是人。
可以认为,生成式人工智能的运用,并没有完全排除人在创作中的地位。即使在实施阶段人工智能已基本取代人的参与,但在构思阶段仍然是人基于算法设计和数据选择在发挥作用。人工智能算法模型和训练数据的差异,对所生成内容的风格会起到重要影响。训练数据的来源和人工标注的偏好,都会决定所生成内容的风格和质量。而上述训练的完成,都是人工智能设计者直接主导和安排的结果。有鉴于此,以“构想”和“实施”的过程来涵摄人工智能生成内容,人工智能的设计者仍然通过决定人工智能的核心代码、训练数据来源和偏好,以及自身发展方向来决定“构想”,因此应该将人工智能的设计者视为作者,实践中由于计算机软件的开发设计者众多,所以版权一般由作为人工智能投资者的法人享有。直接否定人工智能生成内容的可版权性,不但会导致作品判定要件上的双标,还会破坏《著作权法》长期构建的激励功能。
四、涵摄如何延续:版权归属的类别与界定方法
将人工智能生成内容的作者认定为人工智能的设计者,仅仅是在初始权利配置上的安排。但生成式人工智能软件在设计完成后,目标是向普通的网络用户提供服务,相当于给已经带来作品数量井喷的“用户创造内容”加上了生成式人工智能的技术之翼,也由此出现了原作品权利人、人工智能设计者与使用者三方之间的版权配置问题。一方面有权利人认为,人工智能生成的内容中包含了其作品,因此向人工智能的设计者和所有者提起版权侵权诉讼;另一方面有人工智能的使用者认为,自己的“提示”才是作品的独创性来源,所以应将其视为权利人。由此可见,除了需要明确人工智能生成内容的版权归属外,还需梳理日常使用人工智能来生成内容所形成的复杂权利关系。
针对人工智能生成内容中与作为训练数据的他人作品构成实质性相似的问题,直接涉及原作品权利人、人工智能设计者和使用者三方的法律关系。在实践中,人工智能需要帮助使用者生成具有某种特定风格或者包含某种特定场景的作品,而人工智能之所以有能力生成上述作品,主要是设计者或训练者在训练过程中向其提供了包含海量同类型作品的数据库。在内容生成的过程中,人工智能时常会不可避免地直接使用数据库中的作品的片段,其中不乏包含原作品独创性元素的部分,由此产生了原作品权利人与所生成新作品权利人之间的版权争议。现今已有不少权利人通过集体诉讼要求人工智能设计者就内容生成中出现的实质性相似问题承担侵权责任,网络上以“AI歌手”面目出现的生成式人工智能模型,甚至大量对音乐作品和录音制品直接使用。同时,由于内容生成后多数都存在不同形式的公开传播,不符合版权合理使用中个人使用、介绍评论与说明、学习研究或者免费表演等法定情形,所以只有事前获得许可方能合法使用。
然而,由于人工智能训练所需的作品数量众多且权利关系复杂,人工智能设计者根本无法在合理成本内完成包括确权、协商和履行监督在内的所有合同环节。在版权制度史上,一般通过以集体管理模式实现权利集中的方式解决许可成本过高的问题。但传统集体管理模式的实现,需要“权利人、集体管理组织、使用者”之间具有稳定的法律关系,权利人为职业作者,使用者为广播组织和出版社等以相对固定方式和范围传播作品的商业机构。相比之下,现今“用户创造内容”和“人工智能生成内容”结合的商业模式,无论是作为训练数据的作品来源,还是生成后的作品使用方式,都早已超出职业化创作和传播的范畴,不但主体数量都过于分散,而且使用目的也更为多元,集体管理所需的那种稳定的继续性合同关系无法形成。在此前提下,为了规避人工智能生成内容可能出现的侵权风险,人工智能设计者采取了在“最终用户服务协议”中纳入格式条款的方式来明确版权归属。
以ChatGPT和Midjourney两款生成式人工智能软件的“最终用户服务协议”为例,两者都对所生成内容的版权做了明确的归属约定。Midjourney的协议区分了付费与非付费用户。针对付费用户,Midjourney在格式条款中规定所生成内容的所有权利归于使用者享有,但排除其中可能存在的他人作品版权。针对免费用户,Midjourney则规定使用者不享有所生成内容的版权,但Midjourney会通过“知识共享协议”以非商业使用为限允许使用者自由使用该内容。ChatGPT虽然并未区分付费和免费用户,但同样将所生成内容的所有权利让与给了使用者,也同时声明排除他人作品的版权和用户输入类似提示所生成的同质化内容。上述权利配置的目的主要体现在两个方面:第一,帮助人工智能设计者规避内容生成过程中可能出现的侵权风险。如果将版权让与使用者,使用者在使用作品时如果被发现与已有作品存在实质性相似,责任将由使用者承担。第二,解决人工智能生成内容可能出现的雷同问题。在多数用户共同使用的情况下,人工智能很可能针对类似提示给予相似的回应。设计者在合同条款中事先告知使用者其可能不是唯一输入某种提示并获得结果的用户,并排除该部分版权的让与,可以避免不同使用者之间出现版权争议。
对于以“提示”引导人工智能生成内容的使用者而言,留给使用者的空间仅是在已生成的多个内容中进行选择和调整,或者针对已生成的内容再次提示改动的意见。这种提示其实类似于电脑游戏画面的玩家通过操作形成游戏画面,操作行为仅仅是通过输入指令将已有的代码转化为画面。由于其并未贡献画面中的独创性元素,该画面的版权仍然属于游戏软件的设计者。在美国版权局驳回Midjourney生成漫画版权登记申请的回复中就明确指出,由于人工智能使用者输入的提示语过于抽象,所以更类似于委托创作中的委托,而非真实参与创作。但如果使用者在生成的内容上增加了额外的独创性表达,则构成对作品的改编。但由于无法判定人工智能所生成的内容中是否包含他人作品,众多使用者也难以就改编问题与人工智能设计者或原作品权利人达成合意,所以仍需要回到人工智能设计者格式合同的解决路径上。首先,在使用者仅以提示方式生成作品的情况下,人工智能设计者与使用者之间的关系纳入委托作品的范围,使用者作为委托人,根据“最终用户服务协议”中的格式条款取得所生成作品的版权。其次,人工智能设计者或所有者应该在没有合同约定的前提下被视为已生成内容的作者,但如果所生成内容中包含了他人作品的独创性元素,设计者或使用者在以法定权利项使用该作品前,必须取得原作品权利人的许可。这种版权法定配置与合同安排相结合的模式的优势性体现在:一方面法定配置可以避免无主作品大量涌入市场而损害对创作者的正向激励;另一方面合同安排则可以控制“用户创造内容”和“人工智能创造内容”叠加带来的高额许可成本。
五、结论
在大数据、算法和硬件计算能力显著提升的背景下,生成式人工智能已经有能力完全介入人类的所有创作领域。然而《著作权法》多年来不断沉淀的独创性解释,仍然可以将人工智能生成内容“教义化”到既有的权利配置体系中。正如德国马克斯普朗克创新与竞争研究所在其针对人工智能知识产权问题的“立场声明”中所言,从现阶段看,专门为人工智能生成内容创设新的法律规范既无必要,也不合理。无论是作为具体构想来源的算法及其生成步骤,还是在数据库训练中通过监督和标注对生成风格和内容的控制,都意味着人工智能在被设计和训练阶段的安排可以视为与创作行为具有直接关联。《著作权法》自摄影技术介入创作时在司法审判中所形成的自然人与创作的关联性判断规则,可以涵摄从机器介入到人工智能介入的历史阶段,人类被认为是创作的唯一来源的论断,在今天也并未因生成式人工智能的到来而被推翻。但由于海量生成内容中尚无法避免出现作为训练数据的作品元素,所以在人工智能软件的“最终用户服务协议”中对权利归属做出合理安排,是现阶段避免侵权风险的必要途径。
-
上一篇:
-
下一篇:
- Ed Sheeran在《自言自语》歌曲的版权上诉中胜诉
- 国家版权局公布第一批版权强国建设典型案例
- 《银翼杀手2049》制片人就人工智能图像起诉特斯拉和华纳兄弟
- 英国:版权与人工智能的对峙将在数月内结束
- 人工智能如何理解语言