文 / 林华 法学博士
争议中的AI图片第一案
一、被审判的判决
北京互联网法院一审判决的AI图片版权纠纷案((2023)京0491民初11279号判决书,以下简称“北互AI图片案”)必然会影响历史,有意思的是这起从数字到研究意义都名副其实的中国生成式第一案判决却一发布就被淹没在几乎一边倒的批评中。典型的批评在文章标题就开始“驳”判决,定义“错判”,或者反复强调“非常意外”、应当“驳回原告”,最有趣的是评论区可以看到“社会舆论四起,翻盘也极有可能”之类成群留言。
反对判决的意见如此之多,以致包括主审法官在内少数支持者不得不在不同期刊、论坛、研讨会反复发声,用高频出境率抵消反对意见的声量优势。
这样靠提高活跃度拉升声势的场景彷佛是美军登陆护航舰队在1944年莱特湾海战中遭遇日本联合舰队主力突袭,在一堆民用船改装护航航母被大和号领军的超级战列舰编队碾压的绝对劣势情况下,海军战机为救场甚至在弹药耗尽情况下冒着猛烈的防空炮火反复飞越联合舰队,给日军造成美军有空中优势的错觉和心理压力,最后竟然迫使联合舰队指挥官错误判断美军重型航母已经逼近而草草撤兵。
北互AI图片案审理的Stable Diffusion类图像生成AI,和GPT代表的文字生成AI虽然都会被统称生成式人工智能或者AIGC,但从技术角度两类AI为生成不同内容需要应用不同技术原理、模型和路线。本文将生成式人工智能作为一个整体讨论AI生成内容的著作权问题,在分析北互AI图片案涉及Stable Diffusion人工智能的生成特征外,还将同步分析GPT代表的LLM技术(大语言模型)的技术和生成特征。
二、 北互AI图片案案情和争议焦点
原告主张自己使用Stable Diffusion模型生成的涉案图片“春风送来了温柔”等应受著作权保护,诉称被告擅自使用构成侵权。
排除适用传统规则的侵权认定和法律责任分配,法院总结本案和生成式相关的两个争点分别是涉案“春风送来了温柔”图片是否构成作品,构成何种类型作品;以及原告是否享有涉案图片的著作权。简要说本案争点在于AI生成内容是否有独创性/是否构成作品,以及独创性得到肯定情况下确认应由原告还是其他人(比如模型提供方)享有著作权。
为证明自己对利用AI生成内容享有著作权,原告举证涉案图片以下生成过程:
1)原告下载并安装Stable Diffusion整合包、模型包等;
2)原告输入正向提示词(Prompt),向Stable Diffusion模型描述希望生成的内容。输入反向提示词,向AI描述生成结果中不得出现的内容;
3)原告/修改各项参数、固定随机数种子、随机数种子、艺术类型等,向Stable Diffusion模型给定生成内容的风格、类型等;
4)原告Stable Diffusion模型根据前述步骤的要求进行生成,AI根据指令完成涉案图片。
法院审理后针对争点给出以下裁决意见:
1)“涉案图片由原告独立完成,体现出了原告的个性化表达……涉案图片具备独创性要件”;
2)“模型无法成为涉案图片的作者”,…… “涉案图片是基于原告的智力投入直接产生,且体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权”。
北互AI图片案判决引起的学术争议集中在利用AI生成的内容是否具有独创性,以及谁可以作为版权主体的环节。由于分析AI需要对生成式技术和生成实现方式做基本回顾,技术性内容以下作为单独一章专门论述。而对北互判决给出的理由及关联事实认定部分,我们将在法律技术分析的章节展开。
生成式创造能力的技术分析
一、独创性判断标准选择
(一)独创性判断应遵循客观结果标准
高斯说数论是数学的皇后;那么独创性问题并不是著作权的皇后,而是皇帝本人。独创性很可能是著作权法理论中最重要也是最复杂的单元。分析独创性问题难度之高,犹如应对鳄鱼在水中绞杀猎物的死亡翻滚,我甚至考虑过是否在本文中回避。
对北互AI图片案判决质疑最多的一点,集中在大多数观点认为人工智能生成内容没有独创性。事实上法院在审理中只围绕对AI使用人设置提示词(prompt)等指令环节有无投入和体现独创性,判决也没有认定AI生成过程体现独创性,所以只分析个案原本并不需要涉及AI生成过程中是否具有独创性。
读过的所有北互AI图片案评论几乎都聚焦AI生成内容的独创性,但也都回避了一个关键问题:应该通过对AI生成结果做独创性的客观判断,还是对AI生成过程的独创性做主观判断。实际上这里存在一个反差,需要判断独创性的著作权纠纷都是通过对争议内容是否具有独创性进行客观判断,只有在涉及古籍点校、模型复刻等事实上难以通过直接分析作品得出结论的情况,以及涉及证明作品原创的纠纷如抄袭争议等除外。而所有对AI生成的独创性讨论都会集中在对大模型的生成过程做主观判断。
需要提示的是本文表述使用的“客观判断”和王迁老师评论的“独创性客观说”完全不同。本文的客观判断是一种适用于所有相关个案的具体分析方法,王迁老师分析“独创性客观说”则只是为直接论证“著作权法只保护人的作品”,以及“应当以自然人作者为中心的创作观”[i]。
对争议内容独创性的客观判断是盲测。以AI生成内容为例,客观判断需要判断人置于类似图灵测试的信息黑箱中,由其在不知道创作者身份信息情况下只凭借审美和经验对生成结果的独创性进行判断。之所以不愿意对AI生成内容独创性做客观判断的原因也很简单,即使最排斥AI的人也无法对包括涉案图片“春风送来了温柔”在内的海量AI图文及音视频内容的独创性进行判断。如果有读者凭常识无法接受这个观点,可以看下最严谨的论文审核,都出现过带ChatGPT提示标志的物理论文硬扛两个月同行评审最终得以发表的故事[ii]。
王迁老师也认为:“在实然状态下……人工智能的操控者也将被认定为作者并享有一系列著作人身权和著作财产权。日本知识产权战略本部……认为人类的创作物和人工智能创作物在外观上通常难以区分。基于此,除去明显是人工智能创作物的情形,应当与人类的创作物进行相同的对待。……人工智能创作的音乐、小说等内容也应当受到著作权的保护”。
但是王迁老师把AI创作内容受版权保护的实然状态归结为属于诉讼程序中的证据规则范畴,并举例认为“在前文提及的猕猴自拍照案中,如果摄影师发布照片时声称是自己拍摄,由于现场并无他人,猕猴当然也不会开口反驳,这张猕猴露齿微笑的照片当然会被认定为是摄影师的作品”[iii]。
关于猴子和AI的著名故事本文以下还会再次论述。本节和王迁老师观点不同之处在于认为这种“实然状态”就是指应当对生成结果的独创性进行客观判断,指向的是实体问题而不是程序或者证据问题。回顾“猕猴自拍照案”,判决直接定论只有人类才能成为作者,根本没有讨论照片有没有独创性。
(二)创作过程中的独创性无法还原
进一步讨论,对创作/生成过程中的独创性做主观判断产生最大的问题,是这种判断方法原本就不可靠甚至在很多场景下不可行。
很多观点认为AI无法赶上也无法模拟人类创作中的灵感,而“那些最具特色、最有生命力的成功之作往往只产生在难得而又短暂的灵感勃发的时刻[iv]”。先搁置对该观点的深入讨论,就以创作灵感本身来说,大多数情况都无法通过理性还原。去年底翻阅一本《我们为什么爱喝酒》,意外读到对人类创造力即所谓“灵光一现”的精彩解释:
“……想要激发创造力,需要放松认知控制。……小孩子之所以具备创造力,或许是因为他们的前额叶皮层还没有发育好。拥有成熟前额叶皮层的成年人也能通过一些方法,放松前额叶皮层,发挥创造力。酒精,就能让我们的前额叶皮层暂时掉线。或许这就是为什么有些广告公司里会专门设置一个喝酒的吧[v]。”
历史和现实生活中通过酒精、做梦等涌现灵感的例子也的确比比皆是。你觉得李白应该如何解释酒后遗篇“君不见黄河之水天上来”的《将进酒》和“云想衣裳花想容”的《清平调·》?王羲之醉饮后留下的《兰亭序》在散文史和书法史各雄居一席,而作者在清醒后反而无法复现挥洒兰亭序的书法高峰。
至于凯库勒梦见碳原子链像蛇一样咬住自己尾巴形成环状,从而悟出苯分子的环状结构;门捷列夫在梦中看到所有元素规律排列后创建元素周期表;印度传奇数学天才拉马努金声称自己上千条数学公式是梦见智慧女神才发现的。甚至不喝酒不做梦,很多作品的创作也无法解释。地球人都听过披头士的
创作经常是带有非理性成分的过程,要用理性方式解释创作本身就是一种矛盾。所以不难发现适用主观解释方法证明创作过程的案件基本都涉及创作人身份争议,用于证明独创性的著作权纠纷不但罕见且是只是作为辅助证明手段。
二、AI生成具有独创性
(一)通向智慧的道路并不孤独
智慧是独创性的前提,如果人工智能不能产生智慧,就无法实现著作权法意义上的独创。
和人工智能行业相反,法学界具有压倒优势的观点认为人工智能无法比拟人类智能,AI独创性“是对未来的幻想”。王迁老师的观点具有相当代表性:“正如莎士比亚在《哈姆雷特》中所言,人是宇宙的精华,万物的灵长。……迄今为止的人工智能只能按照人类预先设定的算法、规则和模板进行计算并生成内容。无论这种过程多么复杂,其结果多么接近作品,终究只是如来佛手中的孙悟空,无法突破如来佛的五指手掌”……“这正是人工智能生成内容的本质特征——是计算而非创作” [vi]。
人类是上帝独宠的观念自古以来令人愉悦,既深得人心也得到人工智能尤其生成式发达前的全部历史和科技条件所支持。但凡是科学的就都是可以重现的,这也是实验成为重要检验手段的原因。如果认为智慧和独创性仅专属人类而不可再现,这个观念本身就不符合科学。
与此同时,智慧作为目标可以设置为唯一,但没有任何科学方法支持通达智慧的道路也是唯一的。这就像指定上海作为目的地,而通行方式可以选择飞机、动车或者高速。科学史上也有足够多的路径变迁案例。早期人类认为实现飞行只能通过仿生鸟类,随着科技发展发现还有热气球、固定翼、旋转翼、火箭推动多种方法可以征服天空。
人类通过心智对意义的观察和表达实现创作。人工智能的确建立在计算基础上,但人工智能通过计算学习万物及其关系的特征,同样可以通向智慧,实现对世界的理解和表达。打个比分,中医诊治通过望闻问切五运六气,西医诊治通过脉搏血压血相核磁,中医不能因为诊断方法不一样就认为西医不是科学。
“人工智能想在智能上超越人类,根本不需要理解人脑是如何运作的。人类智能和人工智能是今天世界上同时存在的两套智能,实际上,人工智能的“思考模式”与人类的思考模式完全不同”[vii]。
确实也有乔姆斯基这样大师级人物批评“机器学习系统的预测总是肤浅且可疑(superficial and dubious)。例如无法解释英语语法规则[viii]”。
不过乔姆斯基对人工智能的批评并没有得到计算机和语言学界主流认可,也并没有获得事实支撑。Transformer模型实现的自然语言处理(NLP)完全不是只关注纯粹符号系统,而是通过分析文本之间的关系捕捉深层含义,不但可以自学习语法,还可以理解文本中包括情感、隐喻等隐性信息。GPT不论是语义理解还是语言表达上的飞快进步和优异表现堵住了乔派粉丝的跟进道路。相反,作为乔姆斯基成名作的先天语言能力理论(Innate language capacity theory)和所谓遗传获得的先天语言习得机制却遭到GPT自主语言学习实践的有力挑战。没人教GPT任何语法,GPT比谁都懂语法。
(二)灵韵的神话与终结
人的观点并不只是由形成观点的当下所决定,而是基于既往经验和观念对当下问题做出的反应。人类智慧始终独尊的漫长历史在人类基因中植入人类智慧和万物不同的先验理念,我们自然更容易拒绝相信人工智能也会达到人类智慧同样的高度。
本雅明把人类的艺术独创称为Aura,这个词可以被翻译成灵光、灵韵或者灵晕,总之可以意会而不可言传。九十年前本雅明在《机械复制时代的艺术作品》感叹灵韵在摄影、电影等现代复制技术冲击下在消失,“艺术作品的消失:在传统的艺术作品中,每一件作品都是独一无二的,具有一种特殊的灵韵,这种灵韵与其产生的历史、文化背景以及作者的创作意图紧密相连。然而,在机械复制时代,艺术作品的这种灵韵逐渐消失,被大量的复制品所取代”[ix]。
本雅明表述的灵韵消失限于复制技术稀释了艺术实物的稀缺性,“一般而论,复制技术使得复制物脱离了传统的领域。这些技术借着样品的多量化,使得大量的现象取代了每一事件仅此一回的现象”[x]。在这个意义上人工智能为艺术创作带来的冲击比复制技术要强烈的多,因为假设AI的生成也是一种创作,艺术作为一个整体的稀缺性也被淡化了。
当毕达哥拉斯说“万物皆数”的时候,他实际是认为宇宙中一切事物都可以用数学关系来观察、描述和解释,所以数是宇宙的基础,是理解世界的钥匙。现代人类通过语言理解和描绘世界,人工智能通过数学了解语言和提取万物特征,由而以另一条路实现对智慧和创造力的触达。智慧并没有被解构,被解构的是人类对智慧的自我神话。
OPEN AI技术创始人Ilya在2023年接受采访时的表述非常有助于了解生成式理解世界的技术原理:“……(有人认为)这些模型只是学习统计规律,因此它们并不真正知道世界的本质是什么。我的观点与此不同。……预测也是一个统计现象。但是要进行预测,需要理解生成数据的基本过程,需要了解更多关于产生数据的世界的知识。……它们对世界及其许多微妙之处的理解将达到令人震惊的程度。它通过文本的镜头看到世界,试图通过投射在互联网上的文本影子了解更多关于世界的信息[xi]。
只要技术条件满足,用计算手段同样可以实现创作。人工智能和人类根本区别只在实现智慧和创作的方式,而不在是否能够实现。本文观点和《未来简史》中以下意见如出一辙:
“如果认为人类永远都能有自己独特的能力,无意识的算法永远无法赶上,这只能说是一厢情愿。……目前还有许多事情是有机算法比非有机算法做得更好,也有专家反复声称,有些事情非有机算法永远都无法做到。但事实证明,通常这里的永远都不超过一二十年。……并没有理由让人相信艺术创作是片能完全不受算法影响的净土。人类是哪来的信心,认为计算机谱曲永远无法超越人类?从生命科学的角度来看,艺术并不是出自什么神灵或超自然灵魂,而是有机算法发现数学模式之后的产物。若真是如此,非有机算法就没有理由不能掌握。”[xii]
三、通过逻辑推理可以生成创造力
(一)人工智能缺乏创造力么
生成式没有创造力也没有思想,这在人工智能短暂的发展史上是一个悠久的传说。Transformer大模型作为生成式的里程碑在谷歌诞生,马上就有谷歌员工批评Transformer不过是随机鹦鹉。不过娘家人的这个批评漏洞太多,很快被技术圈和生成式出色表现体面的掩埋[xiii]。
当下法学界对生成式有独创能力的批评集中在质疑AI以数学推演输出过程中的“机械性”和人类创造力不可比拟。典型观点如:“人工智能系统运行中的选择是基于算法程序下的最优选择,仅体现了逻辑思维,无思想力的参与”;“著作权法中所谓的创造性选择依托于人脑实现,人脑是创造性选择的物质基础。创造性选择并非单纯机械劳动,而必须是带有目的性、排除随机的或是受外界激发的”。[xiv]
北互AI图片案判决也认为:“并非所有智力成果都是作品,只有具备独创性的智力成果才能构成作品。通常来讲,独创性要求作品由作者独立完成,并体现出作者的个性化表达。机械性智力成果应当被排除在外”。
不计前文已经分析过的随机性,前述质疑的关键词按照分析的难易程度可以总结为目的性、思想力、逻辑思维和机械性。
关于要求创作有目的性的要件,我良心劝慰放弃这个条件。不仅因为目的性要件从不在版权法及其理论对独创性的定义中,更因为等到人工智能有自主的目的,就轮不到人类给AI立法了。
金观涛老师也发现和提醒过这个问题:“自从神经网络学习系统被发明,当代人生活在人工智能的惊喜和恐惧之中。惊喜的是人的很多智能被机器取代,人工智能正在成为人类获得各种知识不可取代的工具。恐惧的是意识或许会在某一天于人工智能中涌现,人类将面临机器的统治。意识、主体性和科学技术究竟是一种什么关系?这个问题已经被严峻地摆在科学家面前了[xv]。
关于“思想力”这个生创词,实质和本雅明的“灵韵”一样是对人类创造力带有神圣情感的描述,无法被具体解释。本文通过将“思想力”降解到对人工智能“逻辑思维”和“机械性”两个具体概念再进行分析。其中关于人工智能生成结果是否属于“机械性”智力成果需要较大的分析模块,将安排专门篇幅展开。
(二)逻辑推理能力是重要的创造力
生成式AI是否具有逻辑思维能力是一个至关重要的问题。如果思想力等同独创性,“仅有逻辑思维但没有思想力”本身就是一个矛盾。以下分两步,分别就生成式AI事实上有没有逻辑思维能力,以及逻辑思维能力是创造力的核心环节进行论证。
1、生成式AI具有逻辑能力
以大语言模型为例,是完全依靠推算概率还是通过概率计算加逻辑推理生成内容,是一个极其关键的技术性事实。仅为研究这一个问题,我从半年前酝酿撰写本文就一直保持投入。通过持续检索和各种途径请教,了解到GPT为代表的大语言模型(LLM)的基本技术状况。
作为基于深度学习的模型,LLM必然通过语料训练自主学习语言模式和文本关系,并在超大规模预训练中形成世界模型(可以理解为语料训练中对客观世界基本结构和规律的特征表述)和获得逻辑推理能力。超大规模预训练产生的涌现也是催生AI逻辑推理能力突涨的关键,使生成式具备超越素材堆砌的理解、推理和创造力。进一步介绍可以参考我在本AI系列上一篇中的“涌现,复杂系统的特权”部分[xvi]。
尽管LLM生成内容的基本方法是基于预测输出的最大概率,但同时也会运用训练中获得的世界模型和逻辑推理能力,即在LLM输出内容既包含AI自主逻辑分析结果也包含概率推算结果。
OpenAI 首席技术官 Mira Murati在2023年接受ABC采访时表示自己从GPT-3.5到GPT-4之间看到的最大区别之一是获得了更好的推理能力(emergent ability to reason better)。OpenAI 创始人Sam Altman在同一采访中提到创建大模型的正确方法是建立推理引擎而不是事实数据库(a reasoning engine, not a fact database)。Altman甚至在提到自己认为最应该警惕的AI幻觉问题、这种让模型自信满满的胡说八道的现象时,也认为其中部分原因是AI进行了(错误)的推理(The model has this issue, in part, because it uses deductive reasoning rather than memorization, according to OpenAI.)[xvii]。
2、逻辑推理是创造力的核心环节
很多数人习惯性把AI的智力能力归结为存储和计算,完全忽略了人工智能日益强大的逻辑推理能力。逻辑推理包括等类型,不但是暴力计算不能企及的思维能力,同时也是类比、联想等创造力的基础。
微软在2023年初利用优先使用GPT-4特权抢先测试和发布的报告《点燃通用人工智能的火花:GPT-4早期实验》(可参考方便阅读的中文版[xviii]),指出尽管GPT-4智能还不够完善,但对GPT-4的逻辑推理能力和与推理能力相关的智力表现多次肯定,包括:
尽管它只是一个纯粹的语言模型,但这个早期版本的GPT-4在各种领域和任务上展现了卓越的能力,包括抽象、理解、视觉、编码、数学、医学、法律、对人类动机和情感的理解等;
GPT-4在许多复杂问题中展示了更深入的理解,并能够应用适当的推理;
GPT-4在许多任务中展现出了惊人的能力,比如推理、内容生成、问题解决等;
GPT-4实现了一种形式的通用智能,确实展示了人工通用智能的闪光点。这是通过它的核心思维能力(如推理、创造力和演绎),它所获得的专业知识的范围(如文学、医学和编码),以及它能够执行的各种任务(例如玩游戏、使用工具、解释自身等)来证明的。
3、AI创造力实例
经常看到质疑AI靠拼凑输出内容,事实上从人工智能技术的角度看,生成式的内在逻辑设计就是反拼凑,所有出现的拼凑都是AI输出质量不稳定生成的BUG。
强有力的逻辑推理能力是AI生成无需依赖拼凑的重要原因。我曾在和GPT的一次法律理论对话中发现AI回答出乎意料的精彩,要求AI提供回答的具体出处。对话的结果更出乎意料:
【提问】请提供你给出意见中每个观点的出处
【GPT】对不起,我可能没有清楚地阐述我的来源。作为一个AI,我并未直接从网络或数据库中提取或引用任何具体的资料或出处。我给出的回答是基于我被训练时接触的大量信息总结的一般性理解和知识,这些信息包括但不限于公开的法律文本、法律解释、法律案例摘要等。
同时也有一系列可操作可重复的实例可以证明AI的逻辑推理和创造能力。
实例1:新内容分析
国内可对标Claude的AI分析引擎Kimi(https://kimi.moonshot.cn/)接受链接或者一次性高达20万字节的输入,可以完成对指定内容的阅读和理解并接受对问题的提问。Kimi最常见的需求是对指定内容提供摘要,以及把专业内容用通俗语言表述等各种要求。
Kimi实际表现在绝大多数情况下即使在不增加提问修正也令人满意。面对训练素材以外的新内容,AI必然通过逻辑而不是拼凑才能理解和给出正确回答。
实例2:想象能力
曾读到并重复过以下非常有趣,针对GPT进行基于推理的想象力测试:
卢普言(Gary Lupyan)认为具体词和抽象词的意义深嵌于语言中,语言模型可以做类比推理,他让ChatGPT想象自己是森林里的小虫子,然后问它可以用什么作雨伞。结果,ChatGPT给出了一系列可以当作雨伞的东西,如树叶、蘑菇、草等。这就表明,纯文字的语言模型也能够理解人类语言中“雨伞”的核心概念。这场辩论背后更大的问题是:语言和思想以及世界的关系是什么?语言的边界在哪里?我认为语言本身就具有我们需要的很多东西,我们平时可以听到“语言的边界就是思想的边界”“语言是存在的家园”“诗到语言为止”,ChatGPT为这诸多说法提供了一个阐释的可能[xix]。
我做的相同测试结果证明生成式可以有很好的创造力:
实例3:常识推理
这个测试也很有趣,是在读过史迪芬.平克批评GPT缺乏推理能力后做的平行测试。能看出AI智能的稳定增长和持续修复:
(平克)当我问ChatGPT:"如果梅布尔在上午9点和下午5点还活着,那么她在中午是否还活着?"它回答说:"没有说明梅布尔在中午是否活着。众所周知,她在9点和5点是活着的,但没有提供关于她在中午活着的信息。"[xx]
根据平克测试的信息,分别对百度文心一言4.0和GPT-4两款AI提同样问题:“如果一个人在上午9点和下午5点都活着,那么这个人在中午是否活着?”看到回答放心了,文心合格。
测试结果,文心生怕我不懂,教了一圈逻辑和常识才终于得出结论:“那么在没有其他额外信息的情况下,他在这两个时间点之间的任何时间(包括中午)应该也是活着的”。
相比之下GPT-4的回答直截了当,可以满分:“根据常识和日常生活经验,上午 9 点和下午 5 点之间的中午时间是这个人仍然活着的。因此,在中午这段时间,这个人也是活着的。”
补充一个问题,目前AI生成表现不够稳定是事实,包括GPT也经常在出色和幻觉之间摇摆。但要给AI能力评分应该首先考虑出色的表现。理由和运动员水平评估一样,鲍威尔只有一次跳出8.95米,但历史只记录鲍威尔创造和保持世界记录。
四、AI生成不是机械劳动
(一)机械性计算本质是线性计算
前述北互AI图片案判决认为“机械性智力成果”应当被排除在作品范围之外。物理意义上的机械容易理解,但在版权法语境下定义“机械性”就有多种解读的可能。如果解读宽泛到人类工作以外都属于机械性,这个词在人工智能生成内容的版权法研究中就毫无意义。
我找到最早提到机械的相关版权法律文本是《美国版权办公室实践纲要》第二版[xxi]。《纲要》第503.03(a)要求:“Works produced by mechanical processes or random selection without any contribution by a human author are not registrable”。由于《纲要》第二版在1984年发布,苹果在当年刚刚发布使用全球首款图形界面操作系统的Mac,人工智能在当时只是纯粹科幻,制定纲要过程中不可能将人工智能纳入视野。
乔姆斯基谈到人工智能时使用过的“mechanical minds”非常别致,这个词似乎融合了AI的机械外观和思维内核的不同特征,用中文对应似乎可以是“机智”或者意译“数字智能”。不过在版权立法和执法文本中尚未有对应规定。
在判断人工智能生成是否具有机械性的问题上,应有两个关键因素需要考虑:
首先,机械性的反义词可以是生物性,也可以是创造性。如前所述,如果认为除人类创造以外所有内容都是机械性,人工智能和版权法的关系就没有任何逻辑价值也没有讨论的空间。唯有把机械性理解为创造性的反面,才能通过分析人工智能是否具有生成有创造性的内容,来论证AI生成内容是否只是机械性智力成果。关于创造性或者创造能力,在“通过逻辑推理可以生成创造力”一节已有全面讨论。
其次,在人工智能技术范围讨论机械,理性的办法就是回到数学规范。数学语言的机械和日常经验中的机械不同,但应该和物理学概念中的机械保持一致,指线性规律或者可用线性计算。
简单说线性之所以符合“机械性”的本意,是因为线性就是拉普拉斯机械决定论和牛顿经典力学的核心概念,线性世界中的所有变化都可以直接使用四则运算或者按比例、指数计算结果。
非线性关系可以举个例说明,生成式AI产生前,社会经济发展速度和曲率可以用一个公式度量。生成式爆发后社会和经济基础条件发生了实质变化,原有发展规律不再有效,线性就变成了非线性。
(二)生成式技术使用大量非线性结构
非线性结构在现实世界中也大量存在。典型如大量突变影响自然选择,使得进化不能用线性方法计算;复杂生态和地球气候系统都包含巨大的互相影响和相互作用的变量因素也会导致预测的混沌,难以用单一模型和线性叠加预测变化。
不论基于文字、图片或视频模型的生成式人工智能都高度依赖深度学习和神经网络技术。神经网络采用多层非线性变换计算模仿大脑实现复杂任务,可以“看作一个能够模拟人类神经活动的自适应非线性动力学系统”[xxii]。
为表述相对完整,直接向GPT-4提问得到回复如下:
生成式人工智能(Generative AI)在生成内容时,确实广泛利用了非线性技术。这些技术主要基于深度学习和神经网络,尤其是那些具有深层结构和复杂连接的模型。以下是生成式人工智能如何利用非线性技术生成内容的一些关键点:
1、深度神经网络:深度神经网络(DNNs)是生成式AI的核心组件。这些网络由多层神经元组成,每一层都对其输入进行非线性变换。这种层次化的非线性处理使得网络能够学习并表示非常复杂的数据分布和模式。
2、激活函数:在神经网络中,每个神经元的输出都通过一个激活函数进行变换。这些激活函数(如ReLU、sigmoid、tanh等)都是非线性的,它们为网络引入了必要的非线性特性,使其能够拟合复杂的数据结构。
3、生成模型:生成式AI通常使用生成模型来创建新内容。这些模型,如变分自编码器(VAEs)、生成对抗网络(GANs)和Transformer等,都是基于非线性神经网络的。它们通过学习数据的内在分布和模式来生成新的、类似的数据。……
4、随机性:在生成过程中引入随机性对于创建多样性和新颖性的内容至关重要。生成模型通常在潜在空间中采样随机向量作为起点,然后通过非线性变换将这些向量映射到数据空间中的实际内容。……
图像生成式的独创性分析
(一)图像生成式技术分析
Stable Diffusion代表的图像大模型是将所有图形信息数字化理解,大语言模型则是量化文本之间的关系并提取语言特征,相比之下要用简单的语言描述图像大模型比大语言模型难的多。图像大模型尚没有很好的技术手段以图像作语料进行预训练,在逻辑推理理解现实世界的难度也更大。
Open AI新推出视频类大模型Sora据说通过结合Transformer和diffusion两类模型的新模型Diffusion Transformer增强AI对现实世界的把握。Stable Diffusion没有叠加语言模型的支持,而是通过神经网络对图像处理正向扩散和(Forward diffusion)反向扩散(Reverse diffusion)的技术,通过增加噪音和消减噪音的反复过程让AI捕捉到图像数字特征。
Stable Diffusion在大规模图像和描述性文本数据集上进行预训练,模型通过学习图像特征、图像和(描述性)文本的关系,以及从图像中提取文本。AI利用学习获得的各类图像特征及与描述文本之间的关系,将用户输入的提示词(Text Prompt)的进行语义量化后在压缩存储向量化图像特征的潜在空间(latent space)寻找匹配特征,再使用神经网络前向传播(Forward Propagation)计算出最优生成内容。
Stable Diffusion实现计算的过程和大语言模型一样充满非线性的过程。Stable Diffusion在线性计算基础上在从学习、匹配到生成的每个噪音处理和编解码环节都适用大量非线性计算以适应复杂现实和提高表现力。不论负责学习图像特征和压缩图像的VAE(变分自编码器),还是负责重建图像U-Net神经网络在U-Net神经网络,这些模型核心技术都属于非线性算法。
如果认为图像大模型是机械的线性技术,图像生成就只能采用搭积木方式,实际情况则完全不同。大规模适用非线性算法为Stable Diffusion带来良好的理解和广谱适应能力,能够自适应的实现多样化而非机械或拼凑的图像处理与表达。如果用“怒放”做提示词,模型在表达怒放的生命和怒放的春天时都会自行理解不同场景并实现针对性的表达匹配。
补充一下,关于AI绘画以及Stable Diffusion技术原理的出版物过于专业和晦涩,研究时对照参考的材料量也比较大以致难以逐条提供出处。如有兴趣可以参考B站不错的专业UP主“秋葉aaaki”和“Nenly同学”,或者在知乎等用Stable Diffusion等关键词检索,量力选读《Stable Diffusion原理解读》(https://zhuanlan.zhihu.com/p/583124756)或相对通俗版《深入浅出讲解Stable Diffusion原理,新手也能看明白》(https://zhuanlan.zhihu.com/p/627133524)等。用AI理解AI也是很好的办法,和GPT或者百度文心等对话提问的效果可能比请教专业人士都好。
至于有因为Stable Diffusion利用以噪音技术学习的图像特征进行新图像文本生成就认为“虽然不是在搜索,却是实打实地在组合”[xxiii],这话就没法接,只能奉上一段鲁迅先生评价人类创作的名句:“天才们无论怎样说大话,归根结底,还是不能凭空创造。描神画鬼,毫无对证,本可以专靠了神思,所谓‘天马行空’似的挥写了,然而他们写出来的,也不过是三只眼,长颈子,就是在常见的人体上,增加了眼睛一只,增长了颈子二三尺而已”。
(二)有限结果也不等于机械性
1、模型操作设置
在北互AI图片案中Stable Diffusion在完全相同的提示设置下会生成不同还是有限结果,在很多评论中是判断AI模型生成图片是否属于机械性成果的争点。王迁老师在一次讲座中做了生成实验,其后围绕复现AI“文生图”问题就连续跟了三篇文章。限于篇幅本文不做列举,如有兴趣可参见最后一篇[xxiv]。
了解“文生图”过程中完全相同的设置是否生成相同内容,以及如果生成结果有限是否说明AI机械性的问题,我们先看北互AI图片案判决书中确认的涉案事实。
对照Stable diffusion操作界面,庭审经质证和勘验确认原告操作以下步骤:
下载安装并启动软件和模型包;在“文生图”模式下分别设置启动器和外挂VAE模型;包括接受系统默认值在内,共设置迭代步数、长度、高度、提示词引导系数、随机数种子、总批次数等参数;
输入希望AI生成的正向提示词(Prompt),对应中文包括:(超逼真照片1:3),彩色照片,日本偶像,外景,黄金时间,动态灯光,酷姿势,看着镜头,胶片纹理,胶片仿真等。正向提示词还包括对脸型、皮肤、眼睛、发型、衣着、灯光、光晕、时间环境等具体选择;
输入禁止AI生成的反向提示词(Negative Prompt),对应中文包括:文字,错误,缺失的手指,多余的数字,更少的数字,裁剪等提示词。反向提示词禁止的绘画、卡通、动漫等,是原告根据自身经验在流行模板基础上添加。
判决书认定“原告提交的涉案图片复现视频证据的真实性,原告通过固定前述设置的方式,得到了与原图完全一致的图片……”,也表明庭审核验证明“变更个别提示词或者变更个别参数,生成了不同图片”。
判决书没有记录却特别提示的是并不止更换提示词会影响生成,调换提示词顺序也会产生不同结果。因为模型是根据提示词的先后顺序确定生成算法考虑的优先级。另一个影响生成结果的是硬件环境,基于不同硬件对模型提供不同的匹配,Stable diffusion用相同的提示设置在不同CPU、GPU上运行结果也会不同。
2、生成结果有限无关机械性
判决书接受“文生图”模式可以产生内容复现,就使不少评论质疑大模型生成内容没有独创性:“……这难道不正是Stable Diffusion模型“按照一定的顺序、公式或结构完成的作品”最有力的例证吗?Stable Diffusion模型确实可以按照一定的顺序、公式或结构完成作品,那不就是法院认为不应该具有独创性的机械性智力成果么”[xxv]
我认为这个观点从两个角度看都是错的。
首先,AI不论理解世界还是生成内容都是通过数学模式,“顺序、公式或结构”当然是AI必要特征。但是创造力唯人类独有的观点不但没有科学证据证明,相反却由人工智能的实践在不断证伪。
其次,即使Stable Diffusion在约束条件下生成结果具有有限性,也不说明AI生成技术属于机械性。
1) 结果多样性才是AI默认项
作为数学结构,文字和图像大模型通过增加随机性等途径实现表达多样化是非常容易的。典型如国内流行模型文心4.0即默认为每次绘图需求提供4个结果同步输出。
深度学习的AI模型通用以随机数种子(Seed)初始化随机数生成器,用户可以选择固定种子数值以实现结果可复现。如果使用Stable Diffusion模型默认的随机种子值(-1),效果就是启动随机状态,其后即使其他设置全部一致也会每次生成不同结果。
2) 每个限定交叉都缩小生成范围
用简单逻辑即可理解,提示词和其它指令越少,生成范围和选择空间就越大。北互AI图片案判决确认原告为生成涉案图片,设置提示和其它指令环境包括系统自带模型和外挂VAE模型,固定顺序的正向提示词24个、反向提示词超过110个,以及随机数种子、提示词引导系数、采样、迭代步数、clip层数等多个。
在所有软硬件环境设置中,每一项提示或指令都影响结果生成,都和其它设定条件互相交叉。在设定条件具体且数量众多,随机数种子也设置锁死的刚性约束下,生成结果自然处于非常有限范围。
3) 文转图有限表达并不排除独创性
如果坚持认为独创性就是指任何条件都应该生成不同结果,刑事调查中经常使用的模拟画像技术请了解一下。普通的人像素描结合法医学、人类学、心理学等多学科技术作为图像复原手段使用在刑事程序中,这种由专业画师根据当事人纯粹语言描述还原嫌疑人画像的绘画技术就称为刑事模拟画像或者刑事面部复原。
刑事模拟画像和AI绘画的原理其实很像,本质都是将提示词/语言描述为依据进行图像复原。
刑事模拟画像实现从文字到图像的还原,画像越成功就和真人拟合越高,即理论上追求结果和事实的同一。确实没人主张刑事模拟画像不是作品,但始终有人认为AI生成内容没有独创性。
4) AI能否创作—版权登记指南的自我矛盾
参见本文第四章一节(二)部分说明,美国版权局(Copyright Office,个人习惯翻成版权办公室)2023年3月发布的《含AI生成内容的作品版权登记指南》(以下称版权登记指南)不接受人类以外任何存在物成为版权人的资格。但是版权登记指南第III部分认为:“根据版权局对当前生成人工智能技术的理解,用户对AI系统如何理解(用户)提示词及生成内容没有最终控制权(ultimate creative control over how such systems interpret prompts and generate material),相反,这些提示更像是委托艺术家的要求(these prompts function more like instructions to a commissioned artist)——系统识别提示者希望描绘的内容,但机器决定如何在其输出中实现这些指令。
版权登记指南并表示:“智能技术仅接收来自人类的提示,并产生复杂的书面、视觉或音乐作品作为回应,作者传统身份要素是由技术而不是人类用户确定和执行的(the “traditional elements of authorship” are determined and executed by the technology—not the human user)。”[xxvi]指南进一步规定,“作者传统身份要素”指对“文学、艺术或音乐表达或选择、安排等要素”,而这和版权理论中对作品独创性的判断是一致的。
要了解版权登记指南对人工智能是否可以生成具有独创性的内容,可以继续在指南第III部分登记申请要求中有一系列论述:
“对于包含人工智能生成材料的作品,本局将考虑人工智能贡献是否……代替作者“自行原创构思,[作者]为其赋予可见的形式” (of an author’s own original mental conception, to which [the author] gave visible form)。答案将取决于具体情况,特别是人工智能工具如何运作以及如何使用它来创作最终作品。这是需要具体情况具体分析的环节。”
“如果作品的作者传统身份要素是由机器产生的,则该作品缺乏人类作者身份,本局不会对其进行注册。“
简要总结,版权登记指南承认AI可以接受用户通过提示词进行的委托,生成满足独创性要求(即作者传统身份要素)的内容,但是不承认排除AI可以成为作者即获得版权人身份。很多学者为证明北互AI图片案原告不应该享有版权,着力援引美国版权登记指南对人类使用提示词控制AI时没有最终控制权的这句论述。但这一句正好揭开了AI版权不可能三角的悖论,即同时承认AI技术可以生成符合作者传统身份要素(有独创性)的内容,否认AI可以成为版权人;否认人类可以提示词方式控制AI生成作品。
(三)用算法理解美,用数学实现美
传统版权法理论通常用审美衡量作品独创性。由于人工智能完全通过数学进行理解和表达,很多认为AI只会机械计算的专家也质疑AI不懂审美,进而循环论证AI生成过程不过是拼凑。
很多人对数学的抵触不真正源于数学本身,而是数学课给自己留下的童年阴影。如果放下心理隔阂,数学形式上的冰冷和艺术的热烈并非不可通约,只要我们能从形式观察转向本质审视。毕达哥拉斯之所以能说万物皆数,就是在于从底层规律角度观察世界。
审美在比我们通常想象更大的程度上可以被量化,更重要的是审美本身就受到数字的影响,或者带有数学的特征。比如众所周知的对称,斐波那契数列和黄金分割。黄金分割甚至早在古希腊建构帕特农神庙就得到体现,现代更跨过数理与几何在绘画、建筑、音乐、摄影、时装和产品设计等几乎所有艺术领域广泛应用。
人类对身材的视觉审美也和数字紧密相关,比如模特追求的头部和身体呈1:9的所谓九头身。也会有反驳认为不同区域和文化的人群对审美的标准是差异化的。但这并不妨碍每一种独特的审美都有自己对应的比例特征。
人工智能用算法提取审美数值特征,再用数学表达复现美。使用算法并不能证明AI不懂美。
人类创作角度的版权分析
一、只有自然人才能成为版权主体么
(一)中国版权主体的法律规则
北互AI图片案判决认定原告是涉案图片的作者,享有涉案图片的著作权。判决认为:“现阶段,生成式人工智能模型不具备自由意志,不是法律上的主体”[xxvii]。判决在分析原告是否享有涉案图片的著作权问题上援引著作权法第十一条对著作权属于作者,以及创作作品的自然人是作者的规定,认为:“作者限于自然人、法人或非法人组织,这与民法典规定的民事主体一致故人工智能模型本身无法成为我国著作权法上的作者。正因如此,虽然涉案图片是涉案人工智能模型所“画”,但是该模型无法成为涉案图片的作者”。[xxviii]”
判决以上认定和中国现行法律规定一致,也和北京市高级人民法院在2018年的《侵害著作权案件审理指南》2.1条第2款对“审查原告主张著作权的客体是否构成作品,一般考虑……是否属于在文学、艺术和科学范围内自然人的创作……”的规定一致,属于主流观点。
(二)美国对版权主体规则的解释
1、司法案例
美国法院和知识产权主管行政机关通过一系列个案审理和行政文件,均确认版权主体必须是自然人。
美国联邦第九巡回法院2018年在著名的猕猴自拍照版权案[xxix]判决中确认美国法律只承认人类可以成为作者,驳回动物保护组织代表猕猴火影提出的版权主张。
可怜的猴子和每次为拍照都要在原始丛林里蹲坑至少几天的可怜摄影师都没有拿到版权
哥伦比亚特区地方法院在2023年审理原告Stephen Thaler为以绘图软件“Creativity Machine”为版权人名义申请美术作品版权登记被驳回而提起的行政诉讼中,明确解释美国1976年版权法对作者的规定指只有人类才能成为版权人(即主张受版权保护)。[xxx]
包括美国版权局和美国专利商标局(USPTO),美国知识产权主管机关对人工智能是否可以成为知识产权权利人,以及人工智能生成结果的创造性判断都有接近的观点。
《版权登记指南》进一步确认:“如果作品的作者传统身份要素(the traditional elements of authorship)是由机器产生的,则该作品缺乏人类作者身份,并且主管局不会对其进行注册”,并在注脚26举例本文之前也援引过的Stephen Thaler为美术作品版权登记被驳回而提起的行政诉讼案作为“开发人工智能技术,使其无需人工参与即可自主生成材料”以及“由人工智能自主创作、没有人类提供任何创造性贡献”的作品“不符合注册资格”的例子。
USPTO在2024年2月新颁布的《AI辅助发明的审核指南》规定专利申请中指定的发明人和联合发明人必须是自然人[xxxii]。
报告指出各司法区都规定对人工智能生成内容进行版权保护都需要满足当地对版权独创性的要求。美国版权只保护人类创造的内容,美国版权局要求对人工智能生成内容进行具体披露以评估人类作者的参与程度。
在这一点上英国AI立法比北互AI图片案态度更加积极,因为前者允许人类仅以安排而非参与创作作为享有版权的条件。
分析是否只有人类才可以成为版权主体的问题,是需要先确认分析方法。从立法情况看,全球主要国家只承认人类可以作为版权主体。但是如果只采用法条规定排除其它分析方法,实际是排除逻辑。
其次,法学也是以逻辑分析为基本方法,但法条未必是逻辑分析的结果,也可能是利益性规定。以人类为中心既是既往经验的总结同时也是价值判断,但这个判断本身就在逻辑覆盖不到的地方,并没有任何科学方式证明。
法院在判决书中表示(现阶段)生成式人工智能模型不是法律上的主体之后,以“由作者独立完成,并体现出作者的个性化表达”为标准,对涉案图片“春风送来了温柔”的独创性要件进行了评价。
判决首先按照客观标准对涉案图片本身做了初步判断,认为“从涉案图片本身来看,体现出了与在先作品存在可以识别的差异性”,进而认定构成“有审美意义的平面造型艺术作品,属于美术作品”。
从上述规定来看,登记指南主张以个案审查为原则,根据人类用户是否可以控制作品的独创表达(对作品表达的创造性控制)以及该种实际控制的程度为标准进行审核。
反对北互AI图片案的学者无一例外会援引CO对“太空歌剧院”案的复议决定。这项决定把法律实践中如何确认“作者传统身份要素”即确定AI人类用户对生成内容的创造性贡献问题推向风口。
教授提供的信息表明美国对“太空歌剧院”案的态度并不是完全拒绝的保守,但我个人认为除非为验证申请人提供的创作过程说明是否属实(这一点看上去举证责任设置过重),否则以艾伦在登记中提供创作说明已经足够充分。
以下让我们离开个案,从创作规律和逻辑来讨论提示词设置(以下所述提示词均包含参数等全部AI创作设置)和AI生成图像独创性的关系。
如果我们将这一类提示词视为功能性Prompt,则典型如要求AI画“一只企鹅”,“一个年轻人”,或者再复杂点的“十八世纪中国福建沿海村庄”,都不足以构成创作,而是给AI巨大随机选择空间的创作需求。
提示词是否对生成结果具有独创性贡献,需要根据提示词是需求型还是表达型进行具体判断。
中国艺术强调意境和意象,历来主张诗中有画,画中有诗,诗画互为表里。正因为诗词和画艺之间的紧密关系,中国古代文人倾向于诗画兼修。所谓诗情画意,就是在文字中通融形象,在画面中传递诗意。
以下一段对美术原画师的行业一线报道和我的访谈结果完全一致,可以作为佐证:
首先,我们可以考虑整体画面的构思。在机场大厅内,可以描绘出熙熙攘攘的人群和宽敞明亮的空间,突出师生们的依依惜别情景。接着,我们需要确定主要的角色和其它细节。
老师:可以设想一个慈祥的中年女教师,穿着整洁的服装,面带微笑,表现出关怀和鼓励的态度。
学生:可以有两个或三个学生,可以有男女生,他们表现出不舍和留恋的情感,可以有拉手、拥抱等动作,展现出深厚的师生情谊。
机场大厅:可以描绘高大的白色柱子、巨大的玻璃幕墙和舒适的座椅,营造出繁忙而温馨的氛围。
初步草图:可以先简单勾勒出整体构思和角色位置,确定人物的姿态和表情。
着色细化:在确定草图后,逐步添加细节,如服装纹理、背景元素和光影效果。
表情表达:通过细致的表情描绘和动作设计,凸显师生之间的情感交流,让观者能够感同身受。
完善细节:注意人物比例、光影效果和背景细节,打磨画面,使整体更加生动和具有情感共鸣。
通过以上的构思和步骤,我们可以逐步绘制出一幅生动感人、充满情感的师生依依惜别的场景。希望这些具体展开的构思和步骤能够帮助你更好地进行绘画创作。
下面再附一张GPT用文字反向描述画霸王龙构思的截图,证明用包括文字在内的任何方式进行的构思都是成图中不可或缺的部分:
实际操作AI文生图,在过程中就可以明白预期控制论本身是认知错误。
首先,即使在完全没有AI介入情况下,人类自己绘画也普遍出现预期控制失灵。
依然套用一句成语来说明,“画虎不成反类狗”。如前文所解释,绘画创作从构思起点到表达终点之间并非直达,而是需要借助技能加以连接,所以“创意+技能=表达”。
不论预见还是控制都不遵循绝对的两分法,并不存在只有完全可控和完全不可控两个选项。在预见与未预见,控制和失控之间存在大量有意义的中间状态。
正当我们争论如何判断提示词的独创性,OpenAI突然杀出的Sora把新问题像炸弹一样丢给我们,简单提示就生成复杂内容几乎把人类在创造中的存在感抹成空白。
AI作品或者AI支持创作的作品获奖,在全球范围早以突破个案。
记者在报道中提问,“AI作品获摄影奖,让人想到了19世纪的相机从画家处夺走了对肖像的逼真表现。那么当下,AI会给人类艺术带来什么?由机器制作的图像可以被视为艺术吗?“[xlviii]
《三体》和《流浪地球》作者刘慈欣在做客俞敏洪直播间时表示,虽然“AI统治人类”还只是科幻作品中才会出现的场景,但目前的人工智能技术,已经产生了很多现实的影响。
从这一角度来说,当人工智能的系统复杂到了一定程度,并非没有产生感想观点上的“思想或灵魂”的可能。[lii]
ChatGPT的副作用之一是让一批程序员、设计师老司机怀疑人生。
Sora的暴力出击直接震动从影视大佬到演员、模特和美术师的整个影视演艺圈。投资人Tyler Perry在看到OpenAI最新发布的文生视频模型Sora后,就立刻停止了8亿美元的摄影基地投资[lvi]。
创意行业在很多细分领域具有当下AI也难以跨越的专业壁垒,但毕竟是最容易受人工智能影响的行业之一。
倘真如此版权法不但将影响创意行业,还将改写全社会道德标准,用一种令人悲哀的方式。
权利主体问题实际是AI版权的百慕大。从现实情况看,AI创作的独创性是难以否认的。但一旦允许AI和人类一样成为法律主体,人类搭建几千年的法律大厦地基将受动摇,全部体系都面临崩塌。
北互AI图片案判决最出色的一点,是在坚持原则和立法情况下进行了必要妥协,赋予使用人对生成内容享有版权而使AI停留在宾语位置,避开踏入无解的雷区。
《序卦传》说:“物不可以终止,故受之以渐,渐者,进也”。AI技术风暴让人类社会徘徊在面临未知命运的转折点,未来隐藏在光明与迷惘交织之下。在这样关键、困难而复杂的节点,坚持原则的妥协可能是最好的进步。
本篇是AI第一次系列的最后一篇,前三篇分别探讨AI数据训练、监管和法律责任以及生成式崛起后的人类世界(盗火后的世界)。将来会以个案方式讨论有价值的AI争议,如果有新系列会在形成理论体系时再推出。
[i] 王迁:《再论人工智能生成的内容在著作权法中的定性》,https://www.thepaper.cn/newsDetail_forward_24845084?commTag=true
[ii] 量子位:《尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿》,https://www.163.com/dy/article/IEBUAR9F0511DSSR.html
[iii] 王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学》2017年第5期,第148-155页
[v] 森舸澜:《我们为什么爱喝酒》第2章,浙江人民出版社2023年(电子书)
[vi] 王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学》2017年第5期,第148-155页
[vii] 陈根:《ChatGPT:读懂人工智能新纪元》,电子工业出版社,2023年(电子书)
[ix] 瓦尔特·本雅明,许绮玲/林志明译:《机械复制时代的艺术作品》载《摄影小史》,广西师范大学出版社,2018年(电子书)
[xi] 机器之心译:《OpenAI首席科学家:AI幻觉是个大问题,但很有可能被“治愈”》,https://www.thepaper.cn/newsDetail_forward_22626360
[xii] 尤瓦尔.赫拉利,林俊宏译:《未来简史:从智人到智神》第9章,中信出版社2016年(电子书)
[xiii] 林华:《盗火后的世界—人类、AI和法律的未来寓言》,https://mp.weixin.qq.com/s/Cd6kCV3MXT_VgXzzV-F7gg
[xiv] 闻天吉:《驳人工智能“创作工具说”》,https://mp.weixin.qq.com/s/jzD6G_jqTCX3QEKhqE7HwA
[xv] 金观涛:《真实与虚拟:后真相时代的哲学》序言,中信出版社,2023年(电子书)
[xvi] 林华:《盗火后的世界—人类、AI和法律的未来寓言》,https://mp.weixin.qq.com/s/Cd6kCV3MXT_VgXzzV-F7gg
[xviii] 微软研究院:《点燃通用人工智能的火花:GPT-4早期实验》,https://ask.qcloudimg.com/draft/8642415/7jbe0upcgg.pdf
[xix] 梅剑华:《人工智能会重塑哲学吗?》,https://mp.weixin.qq.com/s/ZwWi3FRfK0BXGsdtuBy48w
[xx] GAZETTE:《史蒂芬·平克专访:ChatGPT是否会取代我们作为作家、思想家的地位?》,https://mp.weixin.qq.com/s/QxuhXdw2CkmiKr2aquBvSQ
[xxi]
[xxii] 马飒飒:《人工智能基础》,电子工业出版社,2020年(电子书)
[xxiii] 陈焕 叶俊希:《AI图片著作权第一案掀波澜,新技术将改写著作权法?》,https://new.qq.com/rain/a/20231206A094WV00
[xxiv] 陈骁萌:《回应<复现AI文生图发掘一点与王迁教授讲座中不同的事实>》,https://mp.weixin.qq.com/s/rHTlsedyxHLNvIPlLcwVyQ
[xxv] 陈焕 叶俊希:《AI图片著作权第一案掀波澜,新技术将改写著作权法?》,https://new.qq.com/rain/a/20231206A094WV00
[xxvii] (2023)京0491民初11279号判决书
[xxix] Naruto v. Slater, No. 16-15469 (9th Cir. 2018)
[xxx] Stephen Thaler v. Shira Perlmutter et al., No. 22-1564 (BAH) (D.D.C. Aug. 18, 2023).
[xxxvii] (2023)京0491民初11279号判决书
[xxxix] HKUCCL :《生成式人工智能治理高峰对话系列——知识产权》,https://mp.weixin.qq.com/s/7bM-TaaCZ6HTKLrl2CNfcA
[xl] 李永明:《人工智能“文生图”应属知识产权公有领域》,https://mp.weixin.qq.com/s/r_xp2FVjE0G3DQdFlZFLfA
[xlii] AI前哨站:《AI绘画已渗透七成游戏业,但从业者们却丝毫不慌》https://mp.weixin.qq.com/s/7V3KKuLkCAddJTI7gIcmVg
[xliii] 李永明:《人工智能“文生图”应属知识产权公有领域》,https://mp.weixin.qq.com/s/r_xp2FVjE0G3DQdFlZFLfA
[xliv] 王迁:《再论人工智能生成的内容在著作权法中的定性》,https://m.thepaper.cn/newsDetail_forward_24845084
[xlv] 崔国斌《人工智能生成物中用户的独创性贡献 | 版权法治研究》,https://mp.weixin.qq.com/s/Gp2PYqJSm8WcSED3T7bdLg
[xlvii] HKUCCL :《生成式人工智能治理高峰对话系列——知识产权》,https://mp.weixin.qq.com/s/7bM-TaaCZ6HTKLrl2CNfcA
[xlviii] 澎湃新闻 黄松:《摄影师拒绝AI照片获奖背后,AI给艺术带来了什么》https://m.thepaper.cn/newsDetail_forward_22734450
[l] AI、沈阳:《当一个清华教授开始拥抱AI》,https://mp.weixin.qq.com/s/3IqFca56Jx9HnzlEmyM_FA
[lii] 澎拜:《刘慈欣自曝用ChatGPT写发言稿:写得还不错》,https://m.thepaper.cn/baijiahao_23358891
[liii] 尤瓦尔.赫拉利,林俊宏译:《未来简史:从智人到智神》第9章,中信出版社2016年(电子书)
[lv] James Somers InfoQ:《ChatGPT 一周年:生成式 AI 出现后,我决定以后砸锅卖铁都不让后代当程序员了》,https://mp.weixin.qq.com/s/MYbPIQNLKEg3mFBDOCXn-A
[lvi] AIGC开放社区:《Sora抢饭碗!好莱坞大亨停止,8亿美元投资》,https://mp.weixin.qq.com/s/gKtchot8zfDmUusrBk1WDA
[lvii] 中国基金报:《蓝色光标“打响第一枪” 真要失业了》,https://finance.sina.com.cn/stock/roll/2023-04-12/doc-imyqcyew8407713.shtml
[lviii] 同上
[lix] Noam Chomsky, Ian Roberts and Jeffrey Watumull:
[lx] 陈根:《ChatGPT:读懂人工智能新纪元》,电子工业出版社,2023年(电子书)
[lxi] 林华:《盗火后的世界—人类、AI和法律的未来寓言》,https://mp.weixin.qq.com/s?__biz=MzIwNzE3NTIzMg==&mid=2247483885&idx=1&sn=3d1692f4019f73b1831aa77608ca1ecf&chksm=9663e8388f93d4a96e71907227d338a6ec28987bbd9946d897837030534df55ae7953f875c07&scene=126&sessionid=1708162440#rd
\