编辑 | 白菜叶
来自包括麻省理工学院在内的多个组织的 14 名钻研人员在《Science》上发表了一篇评论文章,这有助于为更广泛地讨论生成式人工智能对创造性事务和社会的直接作用奠定基础。
论文链接:https://www.science.org/doi/10.1126/science.adh4451
一类新对象的功能,俗称生成人工智能 (AI),是一个备受争议的话题。迄今为止,一个突出的应用是为视觉艺术、概念艺术、音乐和文学以及视频和动画创造高质量的艺术媒介。例如,扩散模型可以分解高质量的图像,大型语言模型 (LLM) 可以在广泛的上下文中生成听起来合情合理、令人印象深刻的散文和诗歌。
这些对象的生成能力大概会从根本上改变创作者形成想法并将其投入生产的创作过程。随着创造力被重新构想,社会的许多部门架构也大概被重新构想。了解生成式人工智能的作用——并围绕它制定政策决策——需要对文化、经济学、执法、算法以及技能与创造力的相互作用进行新的跨学科科学钻研。
生成式人工智能对象,乍一看,似乎完全自动化了艺术创作——这种印象反映了过去传统主义者认为新技能威胁「艺术本身」的例子。事实上,这些技能变革的时刻并不表示「艺术的终结」,而是产生了更为复杂的作用,重塑了创作者的角色和实践,并改变了当代媒介的美学。例如,一些 19 世纪的艺术家将照相的出现视为对绘画的威胁。然而,照相并没有取代绘画,而是最终将其从现实主义中解放出来,从而引发了印象派和现代艺术运动。相比之下,人像照相确实在很大程度上取代了人像绘画。同样,音乐创造的数字化(例如数字采样和声音分解)被谴责为「音乐的终结」。相反,它改变了人们创造和聆听音乐的方式,并帮助催生了新的流派。与这些历史类比一样,生成式 AI 并不是艺术消亡的预兆,而是一种具有自己独特功能的新媒介。作为人类创作者应用的一套对象,生成式 AI 的定位是颠覆创意产业及其他领域的许多领域——在短期内威胁现有的事务和劳动模式,同时最终实现新的创意劳动模式并重新配置媒介生态体系。
然而,与过去的颠覆不同,生成式人工智能依赖于人类创造的训练数据。这些模型通过从现有艺术媒介中提取统计模式来「学习」生成艺术。这种对训练数据的依赖引发了新的题目——例如数据的来源、它如何作用输入以及如何确定作者身份。通过利用现有事务来自动化创作过程的各个方面,生成式 AI 挑战了作者身份、所有权、创意灵感、采样和混音的传统定义,从而使媒介创造的现有概念复杂化。因此,重要的是要考虑生成式人工智能对美学和文化的作用、所有权和信用的执法题目、创意作品的未来以及对当代媒介生态体系的作用。在这些主题中,有一些关键的钻研题目可以为这项技能的政策和有益用途提供信息。
要正确钻研这些主题,首先有必要了解用于描述 AI 的语言如何作用对技能的看法。「人工智能」这个词本身大概会误导性地暗示这些体系表现出类似人类的意图、代理甚至自我意识。基于自然语言的界面现在伴随着生成人工智能模型,包括应用「我」代词的聊天界面,这大概会给用户一种类人交互和代理的感觉。当这些体系造成损害时,这些看法大概会损害对创造者的信任,他们的劳动是体系输入的基础,并转移开发者和决策者的责任。未来的事务需要了解对生成过程的看法如何作用对输入和作者的态度。这可以促进体系的设计,公开生成过程并避免误导性的解释。
生成式 AI 的特定功能反过来会产生新的美学,大概对艺术和文化产生长期作用。随着这些对象变得越来越普遍,并且它们的应用变得司空见惯(就像一个世纪前的照相一样),它们输入的美学将如何作用艺术输入仍然是一个悬而未决的题目。生成人工智能的低门槛可以通过扩大从事艺术实践的创作者群体来增加艺术产出的整体多样性。与此同时,训练数据中嵌入的审美和文化规范和偏见大概会被捕获、反映甚至放大——从而降低多样性。AI 生成的实质也可以为未来的模型提供支持,创造一个自我参照的审美飞轮,可以延续 AI 驱动的文化规范。未来的钻研应该探索量化和增加输入多样性的方法,并钻研生成式人工智能对象如何作用美学和审美多样性。
社交媒介平台的不透明、最大化参与度的推荐算法,可以通过产生「耸人听闻」实质与可共享实质的反馈循环,进一步强化审美规范。由于算法和实质创建者试图最大限度地提高参与度,这大概会进一步使实质同质化。然而,一些初步实验表明,在管理 AI 生成的实质时结合参与度指标在某些情况下可以使实质多样化。推荐算法会放大哪些风格,以及这种优先顺序如何作用实质创作者创造和分享的类型,这仍然是一个悬而未决的题目。未来的事务必须探索由生成模型、推荐算法和社交媒介平台之间的相互作用形成的复杂动态体系,以及它们对美学和概念多样性的作用。
生成式 AI 依赖训练数据来自动化创作的各个方面,这引发了关于作者身份的执法和伦理挑战,因此应该促使对这些体系的性质进行技能钻研。版权法必须平衡创造者、生成人工智能对象的用户和整个社会的利益。如果不直接复制受保护的作品,执法可以将训练数据的应用视为非侵权;如果培训涉及基础数据的实质性转换,则合理应用;只有在创作者给予明确许可的情况下才允许;或受制于允许将数据用于培训的法定强制许可,前提是创作者得到补偿。许多版权法都依赖于司法解释,因此目前尚不清楚收集第三方数据进行培训或模仿艺术家的风格是否侵犯版权。
执法和技能题目交织在一起:模型是直接从训练数据中复制元素,还是产生全新的作品?即使模特不直接复制现有作品,也不清楚艺术家的个人风格是否应该受到保护以及如何受到保护。什么样的机制可以保护和补偿作品被用于培训的艺术家,甚至允许他们选择退出,同时仍然允许应用生成式 AI 模型做出新的文化贡献?要回答这些题目并确定版权法应如何处理训练数据,需要进行大量技能钻研以开发和理解人工智能体系,进行社会科学钻研以了解对相似性的看法,以及进行执法钻研以将现有先例应用于新技能。
一个明显的执法题目涉及谁可以要求对模型输入拥有所有权。回答这个题目需要了解体系用户与其他利益相关者(例如体系开发人员和训练数据的创建者)的创造性贡献。AI 开发人员可以通过应用条款声明对输入的所有权。相比之下,如果体系的用户以有意义的创造性方式参与(例如,该过程不是完全自动化的,或者不模仿特定作品),那么他们大概被视为默认版权所有者。但是,用户的创造性作用力有多大才能让他们拥有所有权?这些题目涉及钻研应用基于 AI 的对象的创作过程,如果用户获得更直接的控制,这些题目大概会变得更加复杂。
无论执法结果如何,生成式人工智能对象都大概改变创造性事务和就业。流行的经济理论 [即偏向技能的技能变革 (SBTC)] 假设认知和创造性事务者面临较少的自动化对劳动力的干扰,因为创造力不容易编码为具体规则(即波兰尼悖论)。然而,新对象引发了对作曲家、平面设计师和作家等创造性职业就业的担忧。这种冲突的产生是因为 SBTC 未能区分分析事务和创造性思维等认知活动。需要一个新的框架来描述创意过程的具体步骤,这些步骤中的哪些步骤大概会受到生成 AI 对象的作用,以及对事务场所要求和不同认知职业活动的作用。
尽管这些对象大概会威胁到一些职业,但它们可以提高其他人的生产力,并大概创造新的职业。例如,从历史上看,音乐自动化技能使更多的音乐家能够创作,即使收入出现偏差也是如此。生成式 AI 体系每分钟可以创建数百个输入,这可以通过快速构思来加速创意过程。然而,这种加速也大概通过消除与白板相关的原型创造的初始阶段来破坏创造力的各个方面。无论哪种情况,生产时间和成本都大概下降。反过来,对创造性事务的需求大概会增加。然而,创意产品的生产大概会变得更有效率,从而以更少的工人获得相同数量的产出。此外,许多应用传统对象(如插图或股票照相)的雇佣事务大概会被取代。几个历史例子证明了这一点。最值得注意的是,工业革命使传统手工艺品(例如陶瓷、纺织品和炼钢)的大规模生产成为大概,而无需非手工业者的劳动;手工制品成为特产。同样,照相取代了肖像画。音乐的数字化消除了学习物理操作乐器的限制,并使更多贡献者能够进行更复杂的安排。这些对象大概会改变谁可以作为艺术家事务,在这种情况下,即使平均工资下降,艺术家的就业率也大概会上升。
由于这些对象会作用创造性劳动,它们还会对更广泛的媒介生态体系带来潜在的下游危害。随着大规模创造媒介的成本和时间的减少,媒介生态体系大概会因分解媒介的创建而变得容易受到 AI 生成的错误信息的作用,尤其是为声明提供证明证据的媒介。这些生成逼真的分解媒介的新大概性,大概会通过所谓的「说谎者的红利」(虚假实质通过破坏对真相的信任而使说谎者受益)破坏对真实捕获媒介的信任,并且还会增加欺诈和非自愿性图像的威胁。这提出了重要的钻研题目:平台干预(例如跟踪源出处和检测下游分解媒介)在治理和建立信任方面的作用是什么?分解媒介的激增如何作用对真实媒介(例如未经编辑的新闻照片)的信任?随着实质生产的增加,集体注意力大概会减少。AI 生成实质的激增反过来大概会阻碍社会在气候和民主等重要领域进行集体讨论和采取行动的能力。
每一种艺术媒介都反映和评论其时代的题目,围绕当代人工智能生成艺术的争论反映了围绕自动化、企业控制和注意力经济的当前题目。最终,我们通过艺术表达我们的人性,因此理解和塑造人工智能对创造性表达的作用是关于其对社会作用的更广泛题目的核心。对生成人工智能的新钻研应该为政策和技能的有益用途提供信息,同时与关键的利益相关者,特别是艺术家和创造性劳动者本身进行接触,他们中的许多人积极参与解决社会变革先锋的难题。
相关报道:https://techxplore.com/news/2023-06-qa-art-humanity-ai.html