编辑 | 白菜叶
来自包括麻省理工学院在内的多个组织的 14 名研究人员在《Science》上发表了一篇评论文章,这有助于为更广泛地讨论生成式人工智能对创造性工作和社会的直接影响奠定基础。
论文链接:https://www.science.org/doi/10.1126/science.adh4451
一类新工具的功能,俗称生成人工智能 (AI),是一个备受争议的话题。迄今为止,一个突出的应用是为视觉艺术、概念艺术、音乐和文学以及视频和动画制作高质量的艺术媒体。例如,扩散模型可以合成高质量的图像,大型语言模型 (LLM) 可以在广泛的上下文中生成听起来合情合理、令人印象深刻的散文和诗歌。
这些工具的生成能力可能会从根本上改变创作者形成想法并将其投入生产的创作过程。随着创造力被重新构想,社会的许多部门架构也可能被重新构想。了解生成式人工智能的影响——并围绕它制定政策决策——需要对文化、经济学、法律、算法以及技术与创造力的相互作用进行新的跨学科科学研究。
生成式人工智能工具,乍一看,似乎完全自动化了艺术创作——这种印象反映了过去传统主义者认为新技术威胁「艺术本身」的例子。事实上,这些技术变革的时刻并不表示「艺术的终结」,而是产生了更为复杂的影响,重塑了创作者的角色和实践,并改变了当代媒体的美学。例如,一些 19 世纪的艺术家将摄影的出现视为对绘画的威胁。然而,摄影并没有取代绘画,而是最终将其从现实主义中解放出来,从而引发了印象派和现代艺术运动。相比之下,人像摄影确实在很大程度上取代了人像绘画。同样,音乐制作的数字化(例如数字采样和声音合成)被谴责为「音乐的终结」。相反,它改变了人们制作和聆听音乐的方式,并帮助催生了新的流派。与这些历史类比一样,生成式 AI 并不是艺术消亡的预兆,而是一种具有自己独特功能的新媒体。作为人类创作者使用的一套工具,生成式 AI 的定位是颠覆创意产业及其他领域的许多领域——在短期内威胁现有的工作和劳动模式,同时最终实现新的创意劳动模式并重新配置媒体生态系统。
然而,与过去的颠覆不同,生成式人工智能依赖于人类制作的训练数据。这些模型通过从现有艺术媒体中提取统计模式来「学习」生成艺术。这种对训练数据的依赖引发了新的问题——例如数据的来源、它如何影响输出以及如何确定作者身份。通过利用现有工作来自动化创作过程的各个方面,生成式 AI 挑战了作者身份、所有权、创意灵感、采样和混音的传统定义,从而使媒体制作的现有概念复杂化。因此,重要的是要考虑生成式人工智能对美学和文化的影响、所有权和信用的法律问题、创意作品的未来以及对当代媒体生态系统的影响。在这些主题中,有一些关键的研究问题可以为这项技术的政策和有益用途提供信息。
要正确研究这些主题,首先有必要了解用于描述 AI 的语言如何影响对技术的看法。「人工智能」这个词本身可能会误导性地暗示这些系统表现出类似人类的意图、代理甚至自我意识。基于自然语言的界面现在伴随着生成人工智能模型,包括使用「我」代词的聊天界面,这可能会给用户一种类人交互和代理的感觉。当这些系统造成损害时,这些看法可能会损害对创造者的信任,他们的劳动是系统输出的基础,并转移开发者和决策者的责任。未来的工作需要了解对生成过程的看法如何影响对输出和作者的态度。这可以促进系统的设计,公开生成过程并避免误导性的解释。
生成式 AI 的特定功能反过来会产生新的美学,可能对艺术和文化产生长期影响。随着这些工具变得越来越普遍,并且它们的使用变得司空见惯(就像一个世纪前的摄影一样),它们输出的美学将如何影响艺术输出仍然是一个悬而未决的问题。生成人工智能的低门槛可以通过扩大从事艺术实践的创作者群体来增加艺术产出的整体多样性。与此同时,训练数据中嵌入的审美和文化规范和偏见可能会被捕获、反映甚至放大——从而降低多样性。AI 生成的内容也可以为未来的模型提供支持,创造一个自我参照的审美飞轮,可以延续 AI 驱动的文化规范。未来的研究应该探索量化和增加输出多样性的方法,并研究生成式人工智能工具如何影响美学和审美多样性。
社交媒体平台的不透明、最大化参与度的推荐算法,可以通过产生「耸人听闻」内容与可共享内容的反馈循环,进一步强化审美规范。由于算法和内容创建者试图最大限度地提高参与度,这可能会进一步使内容同质化。然而,一些初步实验表明,在管理 AI 生成的内容时结合参与度指标在某些情况下可以使内容多样化。推荐算法会放大哪些风格,以及这种优先顺序如何影响内容创作者制作和分享的类型,这仍然是一个悬而未决的问题。未来的工作必须探索由生成模型、推荐算法和社交媒体平台之间的相互作用形成的复杂动态系统,以及它们对美学和概念多样性的影响。
生成式 AI 依赖训练数据来自动化创作的各个方面,这引发了关于作者身份的法律和伦理挑战,因此应该促使对这些系统的性质进行技术研究。版权法必须平衡创造者、生成人工智能工具的用户和整个社会的利益。如果不直接复制受保护的作品,法律可以将训练数据的使用视为非侵权;如果培训涉及基础数据的实质性转换,则合理使用;只有在创作者给予明确许可的情况下才允许;或受制于允许将数据用于培训的法定强制许可,前提是创作者得到补偿。许多版权法都依赖于司法解释,因此目前尚不清楚收集第三方数据进行培训或模仿艺术家的风格是否侵犯版权。
法律和技术问题交织在一起:模型是直接从训练数据中复制元素,还是产生全新的作品?即使模特不直接复制现有作品,也不清楚艺术家的个人风格是否应该受到保护以及如何受到保护。什么样的机制可以保护和补偿作品被用于培训的艺术家,甚至允许他们选择退出,同时仍然允许使用生成式 AI 模型做出新的文化贡献?要回答这些问题并确定版权法应如何处理训练数据,需要进行大量技术研究以开发和理解人工智能系统,进行社会科学研究以了解对相似性的看法,以及进行法律研究以将现有先例应用于新技术。
一个明显的法律问题涉及谁可以要求对模型输出拥有所有权。回答这个问题需要了解系统用户与其他利益相关者(例如系统开发人员和训练数据的创建者)的创造性贡献。AI 开发人员可以通过使用条款声明对输出的所有权。相比之下,如果系统的用户以有意义的创造性方式参与(例如,该过程不是完全自动化的,或者不模仿特定作品),那么他们可能被视为默认版权所有者。但是,用户的创造性影响力有多大才能让他们拥有所有权?这些问题涉及研究使用基于 AI 的工具的创作过程,如果用户获得更直接的控制,这些问题可能会变得更加复杂。
无论法律结果如何,生成式人工智能工具都可能改变创造性工作和就业。流行的经济理论 [即偏向技能的技术变革 (SBTC)] 假设认知和创造性工作者面临较少的自动化对劳动力的干扰,因为创造力不容易编码为具体规则(即波兰尼悖论)。然而,新工具引发了对作曲家、平面设计师和作家等创造性职业就业的担忧。这种冲突的产生是因为 SBTC 未能区分分析工作和创造性思维等认知活动。需要一个新的框架来描述创意过程的具体步骤,这些步骤中的哪些步骤可能会受到生成 AI 工具的影响,以及对工作场所要求和不同认知职业活动的影响。
尽管这些工具可能会威胁到一些职业,但它们可以提高其他人的生产力,并可能创造新的职业。例如,从历史上看,音乐自动化技术使更多的音乐家能够创作,即使收入出现偏差也是如此。生成式 AI 系统每分钟可以创建数百个输出,这可以通过快速构思来加速创意过程。然而,这种加速也可能通过消除与白板相关的原型制作的初始阶段来破坏创造力的各个方面。无论哪种情况,生产时间和成本都可能下降。反过来,对创造性工作的需求可能会增加。然而,创意产品的生产可能会变得更有效率,从而以更少的工人获得相同数量的产出。此外,许多使用传统工具(如插图或股票摄影)的雇佣工作可能会被取代。几个历史例子证明了这一点。最值得注意的是,工业革命使传统手工艺品(例如陶瓷、纺织品和炼钢)的大规模生产成为可能,而无需非手工业者的劳动;手工制品成为特产。同样,摄影取代了肖像画。音乐的数字化消除了学习物理操作乐器的限制,并使更多贡献者能够进行更复杂的安排。这些工具可能会改变谁可以作为艺术家工作,在这种情况下,即使平均工资下降,艺术家的就业率也可能会上升。
由于这些工具会影响创造性劳动,它们还会对更广泛的媒体生态系统带来潜在的下游危害。随着大规模制作媒体的成本和时间的减少,媒体生态系统可能会因合成媒体的创建而变得容易受到 AI 生成的错误信息的影响,尤其是为声明提供证明证据的媒体。这些生成逼真的合成媒体的新可能性,可能会通过所谓的「说谎者的红利」(虚假内容通过破坏对真相的信任而使说谎者受益)破坏对真实捕获媒体的信任,并且还会增加欺诈和非自愿性图像的威胁。这提出了重要的研究问题:平台干预(例如跟踪源出处和检测下游合成媒体)在治理和建立信任方面的作用是什么?合成媒体的激增如何影响对真实媒体(例如未经编辑的新闻照片)的信任?随着内容生产的增加,集体注意力可能会减少。AI 生成内容的激增反过来可能会阻碍社会在气候和民主等重要领域进行集体讨论和采取行动的能力。
每一种艺术媒介都反映和评论其时代的问题,围绕当代人工智能生成艺术的争论反映了围绕自动化、企业控制和注意力经济的当前问题。最终,我们通过艺术表达我们的人性,因此理解和塑造人工智能对创造性表达的影响是关于其对社会影响的更广泛问题的核心。对生成人工智能的新研究应该为政策和技术的有益用途提供信息,同时与关键的利益相关者,特别是艺术家和创造性劳动者本身进行接触,他们中的许多人积极参与解决社会变革先锋的难题。
相关报道:https://techxplore.com/news/2023-06-qa-art-humanity-ai.html