为人工智能创作营造著作权空间

随着人工智能技术的快速发展和广泛应用,近年来,人工智能自主创作诗歌、小说、绘画、音乐已经不是什么新鲜事了。人工创作需要创意素材来“喂养”。这些创作素材都是各种数据形式的数字作品,因此面临着版权侵权的风险。如何妥善解决这一问题,对人工智能技术的广泛应用和社会文化艺术的繁荣发展具有重要意义。
数据的“表达性使用”使得人工智能创作面临版权侵权的风险。
数据的获取和利用贯穿于人工智能创造的全过程。
第一步是数据采集和输入,也可以叫“机读”。据微软人工智能RD工作人员介绍,2017年由人工智能作者萧冰100%创作的世界第一本诗集《阳光失窗》,是人工智能在学习了500多位诗人的现代诗后,经过数万次训练,最终创作完成的。其次是数据处理和分析,也可以称为“机器学习”。人工智能系统对现有的大量资料作品进行分类整理,分析这些作品所表达的思想感情、语言特征和独特的表达风格。最后是数据的生成和传播,也可以称为“机器输出”。由此产生的成果可以达到作品的独创性,有些甚至比人类作者创作的作品更有艺术性。
然而,在这个过程中,数据的“表达性使用”使得人工智能创作面临版权侵权的风险。
这里所说的“非表达性使用”,是指使用原作的目的不是为了利用其原有的表达方式,而是作为事实信息进行功能性使用,原作的艺术价值没有在使用结果中得到再现;“表现性使用”是指使用原作的目的是利用其原有的表现形式,从而在使用结果中再现其艺术价值。
人工智能对数据作品的使用可以分为“表达性使用”和“非表达性使用”。比如为了运行智能人脸识别系统而使用人脸照片,就是一种“无表情使用”。而我们所讨论的“人工智能创造”中对数据作品的使用,显然是“表达性使用”。
人工创作中使用的数据的侵权类型
使用数据的人工智能创作可能侵犯的权利类型包括:
复制权
在人工智能深度自主学习之前,需要将作品作为创作素材进行数字化处理,转换成适合“机器阅读”的标准数据格式。它是在不改变内容的情况下,对已有作品进行全文复制和原件复制,并存储在机器中形成永久复制品,属于著作权法中的“复制”行为。现行著作权法在原有的七种复制类型后特别增加了“数字”复制模式。在作品输出中,如果人工智能最终输出的内容与之前使用的数据作品实质相似,也可能侵犯复制权。
编辑权
在人工智能创作中,如果最终输出的生成内容具有一定的独创性,但仍保留了某一作品或数据库中某些作品的基本表达,则应属于改编作品,这种创作行为可能侵犯了未经许可和支付报酬的改编权。比如微软开发的“下一个伦勃朗”人工智能系统,通过对346幅伦勃朗画作的深度研究,创造出了与伦勃朗风格相似的原画。如果学过的作品还在著作权保护期内,都是侵犯改编权的行为。
传播权
在我国现行立法中,传播权包括表演权、放映权、广播权和信息网络传播权。人工智能创作涉及的传播权侵权风险主要是信息网络传播权和广播权,表现在人工智能创作的输出环节:如果通过网络即时发布机器学习的数据分析结果,可能会侵犯作品的广播权;如果延迟出版,可能会侵犯信息网络传播权。
著作权法中有侵权免责条款,一般有三类原因:合理使用、法定许可和强制许可。我国现行立法没有强制许可制度。法定许可规则确定的四种类型也很难适用于人工智能创造场合。合理使用的几种情况最有可能作为侵权抗辩的依据,但是:就“个人的学习和研究”而言,人工智能创造不符合该条款的规范意图,“个人”通常仅限于自然人。人工智能创造中数据使用的主体是人工智能系统,而不是自然人,控制人工智能创造系统的主体也不是单一的自然人;文章“科学研究”,根据我国现行著作权法第二十四条第一项的规定,为科学研究目的,可以翻译、改编、编译、播放或者少量复制,但未经著作权人许可,不得发表、发行,不能应用人工智能创作;“适当引用”这一条也很难作为人工智能创作中使用的数据侵权免责的法律依据。人工智能创作对数据作品的使用已经明显超出了适当性的要求。
将人工智能创造和利用的数据考虑到合理使用
传统的许可模式难以满足数据大规模利用的实际考虑。
人工智能创作中使用的数据具有低密度的价值,即单个作品对最终创作的贡献非常小,这意味着人工智能创作大量、大规模地使用数据是有意义的。避免对人工智能创作的侵权“原罪”风险的唯一途径,就是逐一获得数据作品著作权人的许可并支付报酬,而这在现实中几乎是不可能的。此时,采用合理使用规则来分配数据资源,可能是社会福利和公共利益最大化的最佳选择。
促进文化艺术繁荣的公共政策考虑
为了降低使用成本,消除侵权风险,人工智能企业倾向于将受版权保护的作品排除在数据库之外,更多地使用不受版权保护的公共领域的数据来训练人工智能。这将导致创作成果同质化、劣质化,不利于著作权法“促进文化艺术繁荣”价值目标的实现。
当人工智能的开发者无法获得著作权人的许可时,机器学习的资源必然会局限于已经进入公有领域的作品。但是,这些已经进入公共领域的作品并不能完全反映人类最新的智力成果,这必然会导致人工智能创作的作品存在隐性偏见。
维护公平竞争市场秩序的思考
一些大型互联网公司通过设置所谓的“服务条款”或“用户须知”格式条款,要求用户在注册时选择允许互联网公司免费使用用户发布的信息。这为大型互联网公司以“用服务换数据”的模式免费使用用户的数据提供了机会,从而使互联网公司规避版权侵权风险成为可能。但这种“服务换数据”的模式通常只适用于大型互联网公司,而中小企业由于用户数量少,无论从数量还是质量上,都无法与大公司相比可以免费使用的数据。久而久之,就会形成强者更强、弱者更弱的不公平市场竞争环境。
促进人工智能技术发展的国家战略考虑
早在2017年7月,国务院就发布了《关于印发新一代人工智能发展规划的通知》。在此背景下,积极营造有利于人工智能技术应用和产业发展的法律环境,以回应国家战略关切,提升我国人工智能领域的国际竞争力,具有现实意义。为了在新一轮科技革命和产业变革的激烈竞争中立于不败之地,中国应该为人工智能创造和使用数据提供更加宽松的法律环境。
数据合理使用规则的比较思考
为了解决人工智能创作中使用的数据的版权侵权风险,2019年正式通过的欧盟DSM指令通过两项条款细化了“文本和数据挖掘的版权例外”的内容。2018年日本《著作权法》修改时,将计算机使用数据的范围从“计算机信息分析”扩大到“提供新的知识和信息”的所有领域。修订后的条例将可以享受侵权免责的行为从最初的复制、改编进一步扩大到向社会公众提供,同时不限制适用主体和目的,给商业机构留下了营利使用的空间。美国法律以其灵活开放的合理使用规则为人工智能技术的应用提供了更好的发展环境。近年来,美国法院在纸张重复检查、人脸识别和数字图书馆建设等案件中采用了相对宽泛的转换使用规则解释,以满足“机器阅读和创作”的需要。
如何将人工智能创造和使用的数据带入合理使用?
适用主题
欧盟的DSM指令用两个条款定义了“文本和数据挖掘”的适用主题。第四条没有明确规定适用主体的范围,而是从行为的角度进行了规定,即“以文本、数据挖掘为目的,复制、摘抄合法取得的作品或者其他内容”的实施主体。可见,第四条并未将其适用主体限定为公益性研究机构。2009年《日本著作权法》中的“计算机信息分析”条款和2018年《日本著作权法》中的“提供新的知识和信息”条款并没有限制适用主体。美国版权法也没有限制适用主体。就我国立法而言,日本不限制适用主体的做法更值得借鉴。
应用目的
欧盟DSM指令正式文本第四条删除了“以科研为目的”的限制,在行为方面规定了其适用条件。一般认为,该条“将适用主体延伸至具有商业开发意义的私人主体”。在日本的著作权法中,无论是2009年的“计算机信息分析”条款,还是2018年的“新知识和信息的提供”条款,都没有排除将数据用于商业目的。虽然美国版权法“四要素标准”中的第一要素注重作品使用的商业性,但不排除带有商业目的的使用仍可构成合理使用。就我国立法而言,可以借鉴DSM指令第4条和日本著作权法的做法,不以非营利目的为适用条件。企业的RD机构显然是为企业的商业目的服务的。如果这类研究因商业性质而被排除在合理使用之外,既不利于企业创新,也不符合国家的政策导向。
适用行为
欧盟DSM指令第3条将其适用行为定义为“复制和提取”,第4条也是如此。一些学者认为它不能完全解决文本和数据挖掘研究发展中的主要法律障碍。2018年,日本《著作权法》将其适用行为规定为“复制、整理、向公众提供”。
就我国立法而言,首先需要明确的是,合理使用规则所适用的行为应当属于著作权法调整的行为。总之,可以豁免合理使用规则的行为,应该是在现行著作权法规定的特定著作权专用权的控制范围内,否则合理使用无从谈起。据此,欧盟DSM指令中的“提取”行为,日本著作权法中的“录制”、“编排”、“向公众提供”行为,都不存在直接的专有权对应。但从这些行为的本质特征和法律效力来看,可以复制、修改、广播,并基于对人工智能创作和使用数据可能涉及的侵权类型的分析,建议将这种合理使用和适用行为界定为复制、改编、广播和信息网络传播四种类型。
综上所述,建议在现行著作权法第二十四条第一款后增加“人工智能创作”这一新的合理使用类型,即“人工智能创作”
热门推荐
最新动态
文章排行