论人工智能生成内容应否享有著作权

日期：2024-04-17 来源：版权理论与实务杂志作者：孙远钊浏览量：

字号：

【内容提要】本文以追本溯源的方式回探著作权保护体系的“基本面”与其中的若干核心概念，以期能正本清源，再以此探索人工智能生成的内容（包括北京互联网法院近期判决的“文生图”侵权案）是否有获得版权保护的可能抑或有其他的途径？其中的种种问题为何？究竟作者与独创性的要求如何适用到以人工智能作为主要创作工具的情形？本文尝试综合国际与国内的发展与见解从事比较性的研究和探讨，并提出相关的结论。

【关键词】人工智能；文生图；作者身份；独创性；“春风送来了温柔”案

一、引言

所谓“万变不离其宗”。[1]在武术（太极拳）当中也有非常类似的核心观念：“虽变化万端，而理为一贯”。[2]其实不分文武，这个中心思想同样适用到研究法律问题的方法，也包括了著作权[3]和其他的知识产权，其主要的意思是，审视问题必须回到并从基本面来着眼和探讨，唯有追本溯源才能正本清源并以此稳步推演应如何与时俱进。[4]

1710年英国国会通过《安娜法》（Statute of Anne），是近代保护著作权的滥觞。[5]经过三个世纪的不断演化，尤其是在数波工业革命当中无数新科技的挑战与考验，当前的著作权法虽然仍有不少的问题，但是基本的结构、组织、肌理、宗旨和导向都已发展得相当成熟和完整。现代著作权保护体系的“本”至少包含了四个面向：（一）从对出版商的保护转化为对作者的保护；（二）从无期限的公权垄断保护转化为有期限的私权保护；（三）从几近绝对的排他权转化为相对的排他保护，必须兼顾作者权利和社会公益之间的微妙与动态平衡；（四）从各自为政转化为全球一致的标准，必须符合国际公约规定的最低强制标准。[6]

目前全球各国或地区的著作权法制也就是在由这四个面向组成的基础上衍生出了对作者在多久期间内可享有人格权与财产权的规制、以是否为作者的独创表达作为能否享有著作权的前提、以及在哪些情况下是否基于某些特殊社会公益的需求必须要求这些权利作出某种程度的退让以平衡社会的需求或经济的发展。换句话说，独创性、保护主体（作者身份）与合理使用（或“权利限制”）是当前只要涉及著作权的问题就难以规避且必须通过的“槛”。

当现代计算机和人工智能都还在萌芽发展的20世纪60年代，就已有学者展开了关于人工智能与著作权问题的讨论。[7]经过半个多世纪的研究和探讨，已确定无论如何都无法绕开这三个主轴。由于合理使用只在涉及侵权时作为抗辩的手段，因此本文将聚焦探究前两者，并兼论其他相关的问题。

二、独创性

传统上凡是由机器自动生成的内容，无论是文字、字型、图像、排序等等，基本上无法享有著作权的保护。这是基于一个影响了全球著作权法制发展的经典案例而来，即美国联邦最高法院（United States Supreme Court）于1991年判决的“白页电话号码簿案”，首次明确了“独创性”（original authorship，也称为originality，或译为“具独创的作者身份或资格”更符合原意）是获得著作权保护的最基础要件并界定了其具体的内涵为何。[8]法院在该案判决，虽然被告大量复制了原告的电话簿，但其中的具体内容（姓名、地址、电话等）都是由没有任何权利的“事实”组成，即使按字母顺序排列也是本当如此，实际上则是透过电脑操作“一键完成”，即使连微量的创意都不具备。联邦最高法院进一步表示：

“在考量一个以事实为基础的产物是否构成具有独创性的作品时，〔法院〕应聚焦在被收集的事实是如何被筛选、协调和安排。……事实永远不具独创性，因此对其从事汇编的作者只能从其如何呈现来主张独创性。……独创性的要求并不严格。……并不要求创新。独创性只要求作者独自从事了筛选或安排（亦即没有复制其他作品的选择或安排），而且展示出了某种最低程度的创意。”[9]

法院在判决书的最后强调，此一判决无论如何不可被解读为对原告汇编其电话簿的贬抑，而是要表明，著作权是对作者创意而非努力的奖励。

据此，美国版权局一直以来的政策是：凡是没有任何人类的创意输入或介入，仅由机器或机械的程序随机或自动生成的内容都不给予版权登记。[10]其中的关键在于，一个“作品”的作者是否基本上为自然人，其所使用的电脑或其他装置是否仅作为辅助工具，抑或作为判定作者身份或资格（authorship）的传统要件（文学、艺术或音乐等表达或是筛选、安排的元素等）实际上并非自然人，而是由一个机器或系统来构想和执行，因此仍无法跨过对独创性要求的最低门槛。[11]

在欧洲联盟，欧盟法院（Court of Justice of the European Union，简称CJEU）自2009年起先后出台了7个与著作权独创性直接关联的判决，目前与美国的司法见解已基本趋同。[12]欧盟法院表示，依据欧盟历来与著作权相关的指令（尤其是2001年的《信息社会指令》Information Society Directive），“作品”的意义首先是指具有原创（或独创）的标的，也就是只能是源于作者自身的智力创作并反映了该作者的个性。[13]其次，要符合“作品”必须由该智力创作的表达所构成。反之，如果一个创作只是由技术限制或规则所决定，那么该创作便不具有独创性。法院表示“作品”的概念必须存在相当精确与客观的意涵从而足以识别的物件，亦即必须“固定”或“附着”（fixed）。法院最终明确表示，任何欧盟成员国的国内法在规制赋予著作权的保护时，凡是对“作品”有独创性以外的其他要求（如具有一定的美学或视觉效果等）都不符合欧盟的法律。[14]

三、作者身份（主体）

与独创性要件环环相扣的另一个要件是作者的身份或资格，也就是著作权所要保护的主体。

在国际规范方面，如《伯尔尼保护文学和艺术作品公约》（The Berne Convention for the Protection of Literary and Artistic Works）和世界贸易组织的《与贸易有关的知识产权保护协定》（Agreement on Trade-Related Aspects of Intellectual Property Protection，即《TRIPS协定》）等主要的法律文件都没有对“作者身份”给予定义。不过据山姆·里基森教授（Sam Ricketson）的研究，在各国协商缔结1967年《伯尔尼公约》（斯德哥尔摩文本）的协商过程中，“各成员国基本上都同意这个名称的意义，也因此认为没有必要再去定义……因此对于关于公约中‘作者’或‘作者身份’唯一合乎逻辑的解释是指创造作品的自然人”。[15]不但如此，里基森教授还指出，如果调研《伯尔尼公约》的条文字句便不难发现，贯穿和支撑其中绝大多数规定的主轴（leitmotiv，或主旋律）就是指人类（自然人）的创作。例如，著作权的保护期间是作者有生之年加上去世后的50年，显然是指自然人，不是机器（虽然基于节税和科技淘汰等各种原因，机器可能会更早就折旧报废了）。[16]

在国内法或地区法方面，美国《著作权法》也没有明文规定，但是司法与美国版权局的实践都已确立了人本主义，也就是作者的身份必须是自然人。[17]法国著作权法（规制于该国《知识产权法典》（Code de la propriété intellectuelle）第一编）开宗明义在第一条确立了著作权作者的人格属性和权利（机器显然没有人格可言）；[18]另对于若干类型的作品（如协作或合作作品、视听作品等）则明定作者必须是自然人。[19]此外，法国最高法院于2015年出台的一项判决也强烈暗示版权的作者是专属于自然人。[20]

德国《著作权法》明定“作者”是作品的创作人。[21]西班牙《知识产权法》第一编（即著作权法）第一条和第二条规定也明确了“作者”必须是自然人。[22]

在澳大利亚，其上诉法院以全院审的方式于2010年出台了一个经典判决，明确拒绝给予由人工智能自动生成的数据库（电话簿）著作权保护。[23]至于欧盟法院则是从其2009年的Infopaq案判决便已确立了受著作权保护的作品必须是源自“作者自身的智力创作并具有独创性”。[24]

比较特别的是英国。其1988年《著作权、设计及专利法》第9条第（3）款对作品的作者身份（authorship of work）规定：“由计算机（或电脑）生成的文学、戏剧、音乐或艺术作品，其作者为对于作品创作从事必要安排的个人。”另在第178条特别对“计算机（电脑）生成作品”（computer-generated, in relation to a work）定义为：“指由计算机（电脑）在没有人类作者的情况下所生成的作品”。[25]当这个法于1987年还在英国国会下议院进行审议时，当时的贸易和工业大臣格拉夫汉之杨勋爵（Lord Young of Graffham）表示，身为起草者，第178条新增的定义“是全球任何地方首个试图针对人工智能的到来给予版权立法。”[26]

如果只为了显示一个法律的制定具有“前瞻性”就简单地去定义，往往会落下好些将来难以处理的问题。这里的状况是，一旦把上述的两个条文并列，再加上独创性的要求，就可看到彼此之间方枘圆凿，无法调和。可以确定的是，依据英国现行的成文法，无论任何作品都至少要有一名自然人“作者”（主体）；如果是电脑系统自动生成的内容，其作者要么是整个人工智能系统的创造人或开发者（但对于透过该程序系统生成的各种物件却几乎没有任何直接的参与或关联），要么就是对于产出特定生成物从事必要创作安排的人。目前还没有出现任何对此直接给予答复的司法判决。[27]

英国政府在其2021年针对人工智能与版权问题展开的专项咨询已然认知了这个问题。[28]然而在翌年6月提出的结果报告中，一方面承认这是个非常具有挑战性的难题，另一方面却以人工智能发展仍在“早期发展阶段”、不可能进行适当的评价为由，不认为在现阶段对版权法进行修改能提供任何的实益，因此决定搁置暂缓，以待将来时机成熟时可再返回检视。[29]英国政府显然未能看到（事实上恐怕当时也无人能够预料）原来时机就在当下：在其报告出台的前两个月，一家位于美国加州旧金山市，名叫OpenAI的创新公司刚推出了一套名为Dall-E 2、能够从事“文生图”的人工智能系统；5个月后该公司又推出了另一套名为ChatGPT的系统，结果快速“引爆”了全球开发和运用人工智能系统的浪潮，也把包括版权在内的各种问题推上了风口浪尖。

无论如何，即使如英国对其自身法律规定的定义和范围都还未能确定，从上述的比较过程应可至少确定一个基本原则：一个自然人的创作过程（creative process）为何是考量该自然人对某个特定的表达（或作品）是否具有作者身份的关键；至于是否能享有著作权以及相关的范围应当为何则需视该独创表达的结果为何而定。[30]

四、作者独创表达/“贡献度”

自然人的创作是依据自身的常识、经验、情绪、感知和想像来表现，人工智能系统（尤其是当前通行，以仿人类卷积神经网络（Convolutional Neural Networks）设计的大模型）则是完全依据从其输入端置入的数据（或数据集data set），透过软件程序的运算然后自动生成（亦即不再有任何人为因素的介入）特定的内容。固然两者都从“一张白纸”开始，要经历各种的“学习”过程，其中的实质内涵与对信息的转化、处理方式却是截然不同。其中的一个主因是，人工智能完全不具备常识，因此固然在接受过“学习”或“训练（优化）”的特定领域可从事非常深入、细致，而且远超人类能力所及的工作，却无法“触类旁通”，从事各种横向的关联思考与领悟。[31]其中的关键是，固然程序设计者可以在每次的系统运算或操作之前先行设定所要处理的各种参数（parameters，包括如何的条件与范围等等，也称为“提示”），整个内容的生成完全是由电脑根据其系统内既有的数据系统和软件预设的统计运算程序自行、自动操作完成。[32]

也正因如此，凡是涉及到运用人工智能系统的操作，至少在所谓的“文生图”过程，属于自然人的表述仅是每次输入到系统内的参数或提示，与系统最后究竟会生成如何的内容不但没有任何关联，也根本无从预期，更遑论任何程度的掌控。相对而言，自然人对文学或艺术的创作通常从一开始就有某些布局和安排。至于那些表述（提示）能否获得著作权的保护，则依然必须回到基本面，依个案情形分别检视是否具有独创性；至于完全由机器或系统自动生成的内容，则显然没有任何著作权可言。

以近期在国内引起了极大的兴趣和讨论，由北京互联网法院判决，由人工智能生成的图像侵权案（“春风送来了温柔”案）为例。[33]法院在判决书中详列了原告对Stable Diffusion这套人工智能系统输入的参数（或提示，见下图）。

论人工智能生成内容应否享有著作权1.png

从中可见，有自然人参与或介入的部分就是到此为止，而这也正完整反映了原告的表述内容。其中并没有任何与最终呈现画面相关的构图、透视或素描等等属于美术创作的不可或缺的基本框架或内涵。诸如“超高品质高细节的原始图像数据处理格式彩色照片，外景，日本偶像，高度细节对称且迷人的脸，棱角匀称的脸，完美的皮肤，皮肤毛孔，梦幻般的黑眼睛……”等等，无论从个别或整体以观，无非只是各种普通、常用的形容词与纯功能或相当主观的表述（依著作权法的术语，都还在“思想”的阶段），不具备最起码的独创性，也就不构成“表达”，没有著作权可言。

反过来说，如果退一万步，就先假定原告享有著作权，那么其权利的范围为何呢？其实应该也非常清楚，就是原告给出的那些参数指令或提示。除非被告也使用了相同或实质近似的参数指令（提示），依然没有任何的侵权行为可言。无论如何，原告无法对一个完全是机器系统自动生成的内容（在本案是多帧图像）竟然还能主张是那些图像内容的“作者”。

这里有个很容易进入的误区，是所谓“贡献度”的问题。由于在判认哪个部分的作者为谁的过程中没有站稳基础，也就是从一开始就没有把完全属于机器或系统自动生成的部分分开排除，于是很自然的就会变成要考量给出参数指令或设置人工智能系统的自然人对最终的生成内容具有多大程度的“贡献”。须知在著作权的领域，唯一会涉及到“贡献度”问题的，是共同作者必须拆分利润的情形，而那也只是一个概估罢了。所谓的“贡献度”本身就有高度的误导性，实际上是根本难以甚至无法被量化，尤其无法以百分之几来衡量或计算。例如俗语所说的“画龙点睛”，对于最后拿根笔只轻轻地在龙眼上点了一下的那个人来说，他（她）的“贡献度”有多大？占比又有多高呢？

不过法院在“春风送来了温柔”案的基本论述和逻辑是，“原告对于人物及其呈现方式等画面元素通过提示词进行了设计，对于画面布局构图等通过参数进行了设置，体现了原告的选择和安排。另一方面，原告通过输入提示词、设置相关参数，获得了第一张图片后，其继续增加提示词、修改参数，不断调整修正，最终获得了涉案图片，这一调整修正过程亦体现了原告的审美选择和个性判断。……因此，涉案图片并非“机械性智力成果”。在无相反证据的情况下，可以认定涉案图片由原告独立完成，体现出了原告的个性化表达。”[34]按照这样的论述，设想一位教授对其指导的研究生给了一些原则性的建议，然后看到学生提交的论文初稿不甚满意，于是又提出了一些修改意见，如此经过几次，难道对最终完全由学生撰写完成的论文，该指导教授竟可反成了论文的作者和著作权利人么？这样的结论显然有很大的问题，可以想见不但会让整个著作权的体系乱了套，更会导致对整个教育体系、出版事业等不知多少行业与市场带来严重的后果。

五、固定与可复制性

另一个关联性的问题是固定性（fixation）与可复制性。位于美国纽约市（New York）的现代艺术博物馆（Museum of Modern Art，简称MOMA）于2023年举行了一个关于人工智能生成图像的特展。他们首先提问：如果让一套人工智能系统遍览该馆的所有藏品，之后能“梦想”和自创出什么呢？于是馆方邀请了美籍土耳其裔的多媒体艺术家瑞非克‧安那多尔（Refik Anadol）设计出了一个能永不停息、也永不重复，能随周遭客观环境的改变也不断自我变化的视觉立体呈现，称为“瑞非克‧安那多尔：无人监督”（Refik Anadol:Unsupervised）的特展。全部的画作都以一整面的大屏幕墙（24×24英尺，约合7.32×7.32米）和超高清画素的投影来显示，而且呈现出的立体图像场景会随周遭环境因素不断改变（如晴天、下雨、光线、人群的移动等等，见下图）跟着产生各种变化。[35]

论人工智能生成内容应否享有著作权2.png

图片来源：《纽约时报》

因此这也不可避免产生了许多的问题。即使先行搁置能否获得著作权或构成侵权的争论，仅是这些画作究竟应该“归功”（attribution）于谁（如何署名）便可能会引起很大的争议甚至冲突：给出“提示”的人或其聘雇的“提示工程师”（prompt engineer）？人工智能本身？开发该人工智能的人（软件设计者或/和其雇主）？还是提供作为机器“深度学习”的各个对象的作者？其次是，纵使可对人工智能的生成内容考虑赋权，那么对于一个从来没有固定形态、一直不断在变化的呈现要如何赋权？所涵盖的范围究竟应该为何？究竟是二维或三维抑或兼而有之？是否符合著作权法对于“固定”的要求？

在人工智能生成内容是否要赋权的讨论中还有一个经常被提出且让许多学者不断纠结的问题是“可复制性”。[36]这个要件之所以被提出，是因为在18、19世纪制定早期的著作权法时，如美国等有配套的版权注册制度，并要求申请人缴交样品存证，因此需要让所有的版权登记申请“固定”于特定的载体从而能确定当事人的具体独创表达为何并且可被复制。[37]像大都会博物馆的这项特展，其中的内容既无法固定，也难以复制，因此就算要考虑赋权，实际上根本无从界定其作品的内涵与权利的范围。

这个例子也多少显示，一个以人为本、为激励人类的创作并保育文化资产而设计、发展的著作权法制与一个在设计上想尽可能地模拟人类思维和表达的系统工具原本就已捍格不入。现在却反而想把这个系统工具的生成结果给倒挂、套回到为人类设计的法规制度里，却因为难以套挂又想扬弃著作权法制既有的基础，就显得是“削足适履”了。

六、结论[38]

“人工智能”迄今还没有一个国际公认的定义，但从各个不同的既有定义中可以归纳出一个共通点：人工智能系统是一种整合模型和算法的信息处理技术。第二届图灵奖得主艾兹格·迪科斯彻（Edsger W. Dijkstra）教授曾在1984年计算机协会中南地区会议上发表的主旨演讲中表示：“电脑是否能思考的问题就与潜水艇是否能游泳的问题同样相关。”[39]于是由此产生了“潜水艇是否会‘游泳’”的有趣问题。这个问题其实是个悖论，毕竟一个具有潜水功能的机器与一个游泳的人之间完全没有可比性，如果硬要用人类对“游泳”的概念去套用到一个毫无生命的机器，势将产生相当荒谬的结果：诸如如果潜水艇真会“游泳”，那么坐在潜水艇里的人呢？是不是也跟着在“游泳”？假如是一艘无人潜艇，那么在陆地上遥控操作无人潜水艇的人是否也在“游泳”？因此，用人类的游泳比赛规则来规制潜水艇是否合适？

同理，至少在现阶段，如果人们总是不自觉地用一种“拟人化”的寄情投射去看待人工智能，无法以软件程序当中设定的逻辑算法来看待这个已经发展了70余年、最近再次推陈出新的机器工具，就很容易造成自我误导。毕竟人工智能最大的问题是没有常识，因此从不保证其生成、输出的结果正确无误，也无法确知是否已排除了侵权的因素和“瞎编胡诌”的风险，因此不能被寄予信任。[40]人类已经投入了几十年去尝试解决，但迄今仍然未果，也成为人工智能继续发展的“阿喀琉斯之踵”（Achilles’ heel，即可致命的短板）。机器的“深度学习”基本上是统计工作，是个只能依据收集到的大规模数据进行快速计算和推导，与人类的原创表达完全不是同一个概念，也恐怕无法从事类比，否则就与“潜水艇是否会‘游泳’”的悖论如出一辙。

虽然社会对人工智能的讨论和应用在近来风起云涌，也让相关领域受到了各大、小投资者的青睐，一时间获得了前所未见的资源投注，但或因其中许多过程的不公开与不透明，极大程度加深了外界的疑虑甚至惶恐，于是也同时兴起了一波著作侵权和其他类型的诉讼。[41]只要其中出现侵权成立的判决，就几乎注定还会有更多的后续诉讼纷纷出笼。这显然会大幅提高人工智能产业后续发展的成本与市场准入门槛，对相关的创新研发也势将造成很大的负面影响。鉴于这些诉讼通常会旷日持久，除非各方能达成诉前和解，整个领域在未来的相当时间当中恐将受限于许多不确定的状态。

无论如何，对于人工智能引发的种种问题和争议，首先必须厘清的是，一旦发生问题，究竟应当由谁来承担责任？当人们还在争论是否应该对人工智能的生成赋权时，或许可从反向审视：是不是首先必须厘清应承担责任的主体，才能接着探究是否应对该主体赋权？现时看到的状况通常是，凡是一提到赋权只见众家争抢，互不相让；但只要发生了问题，一触及义务与责任承担，则只见各相关当事人开始相互推托或彼此交相指责。罗马法法谚有云：“无救济即无权利”（ubi jus ibi remedium），或可以此作为处理相关权责问题的基本准绳。

即使在是否需要对人工智能生成物赋权的讨论上，从来不是否定只有自然人才可具有“作者身份”或“作者资格”（反面的意义则是：凡是由机器自动生成的物件无法获得著作权，因不具独创性），也不是只能在“全盘否定”与“当然赋权”两个极端选项之间作出互不相容、绝对排斥的政策选择，而是要探讨在特定、某种人类可控的程度与范围内，人工智能生成物是否应像当年对摄影作品的保护认定一般，也可受到某种权益保护？即使能跨过或绕开作者资格的门槛给予著作权保护，权利应该归属于谁？保护的标的是什么？范围又应如何？在纽约现代艺术博物馆展出的特展，投射在屏幕上的呈现从不重复，无时无刻都随着周遭环境在变化，又要如何来界定权利？

总而言之，即使要考虑对人工智能的生成内容予以某种赋权，著作权显然并不合适，不是好的政策选项。毕竟著作权法的主要目的是为了激励人类从事文化、艺术与科学的创作和保护文化资产，著作权本身也是以公开换保护，有创作才会赋权。人工智能的代码既然不公开，就不需要换取保护，机器并不需要得到激励，不应用拟人化的角度去看待其生成物。因此，或许可以探讨是否要另行创设某种特殊、单独的权利（sui generis right）给予某些有限的保护，但是其中还是有太多的未知和困难需要进一步厘清、克服，千万不能冒进；抑或就通过厂家“自律”的方式（例如让使用者签订协议，就与现行进入任何网站或使用数据库必须先行同意才可进入的做法相似），反而可以获得更大的效益。对此或可参酌上世纪90年代欧盟与美国对于是否应对数据库给予某种赋权保护引发的巨大辩论（不过却有个共识：数据本身推定无法赋权）。[42]欧盟选择了用特殊赋权的方式保护数据库，但却导致发生许多问题，后来不但遭到欧盟法院以四个判决对此严格设限，[43]且最终自身进行的两次实证调研也显示成效不彰。[44]其中一个最遭诟病的批判是，此种赋权犹如“掩耳盗铃”，背后真正的目的是为了保护特定的投资利益，早已悖离了以公开换保护、公示公知的基本原则。毕竟投资本来应是风险自负。制定特别法来保障特定投资利益不啻以立法手段（公权力）变相促进特定企业或商业利益形成更大的垄断。

有鉴于此，或许诚如《纽约时报》专栏作家埃兹拉·克莱因（Ezra Klein）所言：“我们如此执着于思考这项技术能做什么，以至于忽略了更为重要的问题：它将如何使用？谁又将决定它的用途？……还有一个更平庸但或许更紧迫的问题：这些机器将服务于何人？”[45]他认为人工智能并非真正在为消费者服务，而是听命并服务于投资者的利益：“我们谈论人工智能的技术太多，却基本忽略了驱动人工智能的商业模式。加之这样一个事实：人工智能的吸睛展示，仅服务于吸引巨额投资和收购报价的炒作周期这一种商业模式。”克莱因并引述了人工智能公司Hugging Face的首席伦理科学家玛格丽特·米切尔（Margaret Mitchell，也是原谷歌公司从事人工智能研究的一位关键领头人）一针见血的评论：人工智能不是为预测事实而生，它们实际上是为了编造看起来像事实的东西而生。”[46]最危险的状况是人们被智能工具操控与说服，其实还是一小群人在设法控制多数的人，毕竟机器工具背后的操控者是程序设计者和商业利益。

共1条记录

上一篇：

试论CDN服务器所在地法院的管辖依据
下一篇：

电子游戏规则著作权保护之否定