AI 大模型会不会讲笑话?谷歌 DeepMind 团队实验结果:会讲,但笑点不多

据 TechXplore 昨日报道,谷歌 DeepMind 项目的一个 AI 研究小组近期发现,大语言模型“并不太擅长”编写有趣的笑话。该团队试图在新尝试中,了解大语言模型是否能够创作出笑话甚至完整的单口喜剧。为此,该团队招募了曾在工作中使用过大模型的 20 名专业单口喜剧演员。这些演员需要使用大模型来帮助自己创作完整的单口喜剧,并对结果进行评分。研究人员发现,大语言模型“相当擅长”编笑话,但其中只有很少一部分真正好笑。他们认为生成的大多数笑话都是“泛泛而谈”,鲜有令人惊喜的结果出现。不少喜剧演员则认为 AI 生成

据 TechXplore 昨日报道,谷歌 DeepMind 项目的一个 AI 研究小组近期发现,大语言模型“并不太擅长”编写有趣的笑话。

该团队试图在新尝试中,了解大语言模型是否能够创作出笑话甚至完整的单口喜剧。为此,该团队招募了曾在工作中使用过大模型的 20 名专业单口喜剧演员。这些演员需要使用大模型来帮助自己创作完整的单口喜剧,并对结果进行评分。

研究人员发现,大语言模型“相当擅长”编笑话,但其中只有很少一部分真正好笑。他们认为生成的大多数笑话都是“泛泛而谈”,鲜有令人惊喜的结果出现。

不少喜剧演员则认为 AI 生成的笑话缺乏“尖锐性”,而这是需要让笑话变得有趣的因素之一,在他们之中,也有许多人认为结果“平淡无奇”。但另外有一部分喜剧演员认为,大语言模型在生成“套路”方面很有用,自己则可以围绕这些“套路”再创作笑话

研究团队认为,考虑到大语言模型的制作者会使用过滤器来防止可能令人觉得反感或受到冒犯的输出,因此 AI“讲”的笑话不够好笑并不让人惊讶。

IT之家附论文地址:https://arxiv.org/abs/2405.20956

相关资讯

专访唐杰 | 我国首个超大智能模型「悟道」发布,迎接基于模型的AI云时代

唐杰认为,超大规模预训练模型的出现,很可能改变信息产业格局,继基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于模型的 AI 时代。智源研究院致力于成为这样一个时代的引领者,集聚各方资源力量,构建一个超大规模智能模型技术生态和开放平台,供北京乃至全国的研究人员、开发者和企业使用。

硬科技起飞,这家成立仅三年的AI研究院已颇具国际风范

摘要:「我认为历史上多数突破性研究成果的出现都是偶然事件,而研究机构所有努力都是为了提升这类偶然事件发生的概率。」张宏江说道。他所牵头的「创新型研究院」,即是一种积极探索,短短3年已展现一派生机。

AI可解释性及其在蚂蚁安全领域的应用简介

可解释性相关算法作为蚂蚁集团提出的“可信AI”技术架构的重要组成部分,已大量应用于蚂蚁集团安全风控的风险识别、欺诈举报审理等场景,取得了一些阶段性的成果。本系列文章,我们将以风控领域具体应用为例,尤其关注领域专家经验和机器学习方法的交互结合,介绍蚂蚁集团特征可解释、图可解释、逻辑可解释等算法方案的探索和落地。专家点评:沈超 西安交通大学教授、网络空间安全学院副院长AI可解释性是可信AI的重要组成部分,已成为人工智能领域的研究热点。可解释性有助于用户理解系统的决策逻辑并建立信任,从而进一步加快AI技术在领域中的可信应