2024 年另类 AI 评测标准走红:“威尔・史密斯吃意大利面”领衔

随着人工智能视频生成技术的不断发展,一个有趣的现象开始在业内流行:当一家公司发布全新的人工智能视频生成器时,似乎总有人会第一时间用它来制作威尔・史密斯吃意大利面的视频。这不仅演变成了一种网络热梗,更成为衡量新型 AI 视频生成器性能的非官方基准 —— 检验其能否逼真地呈现史密斯狼吞虎咽吃面的场景。史密斯本人也在去年二月通过 Instagram 发布了一段模仿视频,亲自参与了这场网络狂欢。

据 TechCrunch 报道,随着人工智能视频生成技术的不断发展,一个有趣的现象开始在业内流行:当一家公司发布全新的人工智能视频生成器时,似乎总有人会第一时间用它来制作威尔・史密斯吃意大利面的视频。这不仅演变成了一种网络热梗,更成为衡量新型 AI 视频生成器性能的非官方基准 —— 检验其能否逼真地呈现史密斯狼吞虎咽吃面的场景。史密斯本人也在去年 2 月通过 Instagram 发布了一段模仿视频,亲自参与了这场网络狂欢。

2024 年另类 AI 评测标准走红:“威尔・史密斯吃意大利面”领衔

AI在线注意到,“威尔・史密斯吃意大利面”只是 2024 年人工智能领域众多奇特“非官方”评测标准中的一个,此前还有一位 16 岁的开发者开发了一款应用程序,让人工智能控制《我的世界》(Minecraft)游戏,并以此测试其建筑设计能力。与此同时,还有一位英国程序员创建了一个平台,让人工智能在“你画我猜”(Pictionary)和“四子棋”(Connect 4)等游戏中相互对战。

人工智能领域不乏更学术化的性能测试,那么为何这些略显怪异的测试反而能够迅速走红呢?原因之一在于,许多行业标准的人工智能基准测试对普通人来说过于晦涩难懂。企业经常标榜其人工智能在奥林匹克数学竞赛或博士级别难题中的解题能力,但大多数人使用聊天机器人只是为了聊天或回复电子邮件。

即使是行业内普遍采用的评测方法,也未必更有效或更具信息量。以受到众多人工智能爱好者和开发者密切关注的公共基准测试平台“聊天机器人竞技场”(Chatbot Arena)为例,其允许任何网络用户对 AI 在特定任务上的表现进行评分,例如创建网页应用程序或生成图像。但参与评分的用户往往不具有代表性,他们大多来自人工智能和科技行业,并且他们的投票也常常基于个人且难以捉摸的偏好。

像“四子棋”“我的世界”和“威尔・史密斯吃面条”这类奇特的人工智能基准测试显然不是严谨的实证研究,甚至不具备普遍适用性。因为即便 AI 能够完美生成“威尔・史密斯吃面条”的视频,也并不意味着其能很好地生成汉堡的图像。

这些另类的 AI 基准测试可能在短期内不会消失,毕竟它们不仅具有娱乐性,而且还易于理解。2025 年,又会有哪些新奇的基准测试会走红呢?

相关资讯

只谈「技术」,不谈「安全」?今晚,我们聊聊人工智能的AB面

聚焦隐私计算、Deepfake、对抗学习等AI安全领域,精彩全分享。

优必选科技四上春晚,“拓荒牛”机器人展现硬科技创新力量

2月11日,在央视2021牛年春晚的舞台上,优必选科技全新研发的首款大型四足机器人化身“拓荒牛”,与刘德华、王一博、关晓彤等一起呈现了科技感十足的创意表演《牛起来》。它们以拼搏进取的深圳 “拓荒牛”为设计原形,融合祥云及中国红等传统文化元素,以绚丽的灯光及机械结构诠释科技美感,伴随激昂的音乐奔腾向前。从2016年春晚540台Alpha机器人登台齐舞到2018年春晚24台Jimu汪汪组队拜年,再到2019年春晚6台Walker机器人与演员同台表演歌舞《青春畅想》……优必选科技已经四次登上春晚舞台,展示中国人工智能和机

矩阵元获批“上海市分布式隐私人工智能技术创新中心”

近日,上海市科学技术委员会发布了《关于2020年度上海市技术创新中心建设立项的通知》,为贯彻落实《关于进一步深化科技体制机制改革 增强科技创新中心策源能力的意见》,推进重点产业领域技术创新,经专家评审论证,确定将“上海市特种数控装备技术创新中心”等18家技术创新中心列入2020年度上海市技术创新中心建设立项计划。矩阵元全资子公司上海阵方科技有限公司将承担“上海市分布式隐私人工智能技术创新中心”的建设工作。党的十九届四中全会提出将数据与资本、土地、知识、技术和管理并列作为可参与分配的生产要素,这体现出数据在国民经济运