本文来自微信公众号:硅兔赛跑(ID:sv_race),作者:Otter,原文标题:《AIGC究竟是打工人的福音,还是噩梦?》,题图来自:视觉中国
过去很长一段时间,人类对AI的担忧还停留在可控的范围内,因为技术所限,AI更多地在替代人类从事重复性高、繁琐枯燥的“dirty work”。
但现在,一切都不一样了。各种AIGC应用,包括自动生成文字、图片、视频、代码的“AI打工天团”相继登场,文案、插画师、视频制作人,甚至程序员都陷入“被AI替代”的恐慌。
人类引以为傲的创造力也沦陷了吗?
一、“抄”你不商量:版权问题是悬于AIGC之上的达摩克里斯之剑
AIGC是指利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。
随着生成扩散模型和多模态预训练模型等技术的快速发展,在图文生成效果上有了显著进步,AI可以快速、灵活地生成不同模态的数据内容,极大地助力了2022年AIGC赛道的爆火。据Gartner预计,到2025年,AIGC将占全球所有生成数据的10%。
硅谷众多一线VC纷纷将目光瞄准AIGC初创公司,尤其是生成式AI艺术这一领域,今年有两家独角兽 Stability 和 Jasper 均获得了超过一亿美元的融资,估值突破十亿美元。AI绘画的热度还未散去,OpenAI的ChatGPT又掀起了AI问答的新热潮。
但在11月份AI编程辅助工具GitHub Copilot被集体诉讼告上了法庭,AIGC的合法性也被推到了风口浪尖。诉讼原告声称微软、GitHub和OpenAI侵犯了其版权,Copilot复制开源代码时并没有提供署名。虽然目前该案件尚处于早期阶段,前景并不明晰,但可以肯定的是AI版权之战的第一枪已经打响,该诉讼中的任何细节,都可能决定AIGC未来发展的走向。
展开全文
图源:Analytics Insight
该诉讼案呼应了很多设计师、程序员等内容创作者的担忧,也让我们清醒的看到,无法确权和版权争议将是AIGC公司未来发展的“掣肘”,是AIGC头上的达摩克里斯之剑,正“悬”而未决。
艺术不是拼贴,但真正产生问题的是模型的训练方法。
很多艺术家对以 Stable Diffusion 和 Midjourney 为代表的AI艺术公司强烈谴责,表示通过海量素材投喂的AI并不具备艺术创作的能力,艺术不是拼贴,但其实现在的AI 模型不会复制和拼接现有艺术作品。相反,他们使用机器学习来学习概念,比如人的眼睛是什么——通过自身的理解来创作作品。
真正产生问题的是AIGC算法模型的训练方式,它们是通过识别和学习数据中的模式来工作,而这些程序用于生成代码、文本、音乐和艺术的训练数据本身是由人类创建的,大部分是从网络上抓取而来的,其中一些内容是受到版权保护的。
二、AI作品的版权争议,确实有些关键问题需要回答
1.由AI生成的作品合法吗?
训练模型在某种程度上是“合法”的,但该模型的应用可能是侵权的。
目前AIGC大多数模型都是根据从网络上获取的大量内容进行训练的,AI研究人员、初创企业和科技巨头们之所以敢放手使用,原因就是使用这些内容(至少在美国)受到合理使用原则的保护。
不过,美国知识产权法的研究教授丹尼尔·热尔维斯(Daniel Gervais)指出,决定这些内容“是否合理的使用”有两个因素需要关注,即“使用的目的或性质是什么,对市场的影响是什么。” 即:是否“改造性”地使用,以及“是否会与原创者竞争并威胁其生计?”,而AIGC已经明显触及到了警戒线。因此训练模型在某种程度上是“合法”的,但该模型的应用可能是侵权的。就类似于为了拍电影而印假钞,但印出假钞还真的用来买东西。
在判断“是否合理的使用”中还有无数种其他情况,其中的输入、目标和输出有着具体的权衡倾向,所以最终“是否合法”的法律裁决还是要受到种种细节的影响。
2.由AI生成的作品,版权该归属于谁?
专利制度假定权益主体是人,机器创作的内容需要有自己的知识产权法和国际条约。
目前除了英国、爱尔兰、新加坡等国家认可计算机程序可作为作者之外,多国版权法保护的都是自然人的权益。依据大陆法,我国著作权法实施条例第二条规定:“著作权法所称作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果”。AI没有独立人格,不具备我国著作权法规范中“作者”的主体资格,AI背后设计者、开发者、使用者才应该是AIGC版权的权属者。但目前AI作品的法律性质不明,是否属于著作权法上的作品仍存在争议。目前,一般认为,AI软件设计者已经从软件版权中得到补偿,AI作品版权主要在软件所有者和使用者之间分配。
在美国,有大量投入的利用AIGC的内容可以认为是属于二创者本身的,但目前具体的归属需要根据实际情况一一判断,大量投入的量化并不明确。
而涉及到为借助人工智能生成的作品授予版权,投入界定的标准将会是一个持续存在的问题。如果只是单纯地输入‘由梵高画的猫’而生成的内容,是不足以在美国获得版权的。计算机科学家乔治·弗朗切切利(Giorgio Franceschelli)撰写了有关人工智能版权问题的文章,他表示,衡量人类输入对案件判决“尤其正确”。因此,如果你尝试使用不同的提示,并制作几幅图像,通过微调,并持续地进行更多的创意工程,相当高的智力投入,大概率将受到版权保护。
有条件地赋予使用人初始版权,可促进AIGC软件使用和作品传播,激励更开放的表达和创作。
三、AIGC无序发展阶段,有哪些解决方案在进行?
由于行业尚处于无序阶段,各个国家也有不同的政策,AIGC的风险具有未知性和复杂性等特点,很多企业对于风险的预测、防范和应急处置能力均尚未完善。
在Shutterstock与OpenAI合作销售基于算法生成的图像时,其竞争对手Getty Images,则出于种种风险的考虑,明确表示禁止在该平台销售生成式AI内容(如 DALL-E、Midjourney 和 Stable Diffusion生成的插图。)
而Adobe则选择“有限制”地开放,公开表示只要符合特定标准,就允许在图片库Adobe Stock中上传生成式 AI 艺术品进行售卖。但上传前必须标记 AI 制作的内容,并且需要拥有其参考图像或文本的商业版权。
同时,Adobe还为自身AI绘画的付费服务从版权上提供了解决方案,官方表示如果遇到作品版权纠纷问题,他们将完全承担买方的损失,由此让付费使用AI绘画功能的用户不必产生版权方面的忧虑。
12月09日,应对侵权问题 GitHub推出了 "Copilot for Business "计划,每个用户每月花费19美元,除获得基础的功能之外,还增加了许可证管理和组织的策略管理功能。GitHub表示,该产品具有行业领先的隐私性,"不会保留代码片段,不会存储或分享你的代码,无论数据是来自公共资源库、私人资源库、非GitHub资源库还是本地文件。
同时,很多公司和研究人员已经探索与创作者实现共赢的方法。
Shutterstock表示,它计划设立一个基金,以补偿那些使用他们作品来训练算法的个人,而DeviantArt为网络上共享的图像创建了一个元数据标签,警告AI禁止引用。而“The Stack”则是一个专门用于训练人工智能的数据集,旨在专门避免侵犯版权的指控。它只包含最宽松开源许可证的代码,并为开发人员提供了一种根据请求删除数据的简单方法。
我们可以看到,AIGC相关企业的版权意识已经有明显的进步,很多平台都在试图通过一种“负责任”的方式来解决AI作品存在着著作权归属不清的现实困境。
综合来看,AIGC正在降低内容创作门槛、释放创作能力,但对相关的法律法规和监管治理能力也提出了更高要求。就像在音乐盗版碟盛行的21世纪初,很多盗版软件在当时完全是非法的,而今天,我们有Spotify和iTunes这样的公司。
相信不远的未来,AIGC行业也会出现更多合法合规的巨头公司。
参考来源:
Gartner predicts rise of distributed data architectures, smarter AI and accelerated automation(siliconANGLE)
The lawsuit that could rewrite the rules of AI copyright(TheVerge)
Hartz: What is the role of AI in IP law? It depends.(TheIndianLawyer)
The scary truth about AI copyright is nobody knows what will happen next(TheVerge)
Intellectual Property Law for Artificial Intelligence(Indepat)
Getty Images bans AI-generated content over fears of legal challenges(TheVerge)
Adobe accepts AI-generated stock art, with limits(engadget)
Artificial intelligence is breaking patent law(nature)
中华人民共和国著作权法实施条例
本文来自微信公众号:硅兔赛跑(ID:sv_race),作者:Otter
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP