ACL主席:ACL不是AI会议

敲响警钟还是走向封闭?「ACL 不是 AI 会议(ACL is not an Al conference)」,在泰国曼谷举办的 ACL 2024 上,今年的 ACL 主席 Emily M. Bender 抛出了一个极具争议的结论。ACL 大会是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 大会在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。近年来,随着深度学习等方法成为 NLP 研究的主流,越来越多的人将这一会议视为 AI 会议,大部分

敲响警钟还是走向封闭?

「ACL 不是 AI 会议(ACL is not an Al conference)」,在泰国曼谷举办的 ACL 2024 上,今年的 ACL 主席 Emily M. Bender 抛出了一个极具争议的结论。

图片

ACL 大会是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 大会在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。

近年来,随着深度学习等方法成为 NLP 研究的主流,越来越多的人将这一会议视为 AI 会议,大部分投稿都和 AI 相关。Emily M. Bender 似乎看到了这种倾向的一些弊端。

在演讲中,她强调了 ACL 作为计算语言学协会举办的年会(Annual Meeting of the Association for Computational Linguistics),其核心并非人工智能,而是更专注于语言技术和计算语言学。

图片

Bender 明确指出,她不将 AI(人工智能)作为 ML(机器学习)的同义词。她认为机器学习(包括深度学习)为语言技术和计算语言学提供了许多有用的技术,但当焦点转移到 AI 时,就会出现问题。

图片

计算语言学和自然语言处理(CL/NLP)关注的是语言的相似性 / 差异性、信息在语言中的表示方式、如何构建技术来帮助不同语言的转录、翻译、摘要、信息获取等,以及如何评价这些技术、哪些中间表示对这些技术有用、不同 ML 技术对不同任务的效果如何、语言技术如何与现有的权力体系相互作用。

图片

AI 领域的问题包括如何构建能够进行类似人类推理的思考机器,如何使这些机器在认知工作上超越人类,如何自动化科学方法,以及如何自动化创造性工作等。

图片

AI 领域还提出了一些观点,例如人类的命运是与机器融合成为超人类,奇点的到来是不可避免的,以及 AI(实际上是合成文本机器)可以替代我们彼此之间应提供的服务(教育、医疗、法律代表)。

图片

AI 领域存在多种问题,包括来自风险资本和亿万富翁的强烈兴趣等。

图片

Bender 还批评了 AI 领域的一些不良研究实践,如不当使用基准测试、要求与 SOTA 的封闭模型进行比较评估、数据集过大导致缺乏保留数据等。Bender 表示,如果你的研究问题集中在「如何证明我的机器具有智能」上,那么这种关注点可能会扭曲研究实践。

图片

她还指出,AI 领域的焦点导致了糟糕的审稿实践,例如不使用大型语言模型(LLMs)或不提供 SOTA 大小的 LLM 结果的论文可能会被认为不感兴趣。

图片

与 AI 领域的不良实践相对比,CL/NLP 领域的研究最佳实践包括对技术的适用性、对人类语言行为的理解、良好界定的评估、内在和外在的评估、坚实的基线、保留的测试数据和详细的错误分析。

图片

图片

Bender 表示,CL/NLP 研究建立在对数据的理解上,包括对语言如何工作的知识(即语言学)和数据集文档。

图片

在可复制性和可重现性方面,Bender 强调了科学是关于在先前研究基础上构建,而不是仅仅为了达到 SOTA。

图片

在社会影响方面,CL/NLP 研究关注其技术对社会的影响,包括伦理和 NLP 研究的历史,以及理解语言和技术将被谁使用、为谁使用、对谁使用,以及谁可能因被排除或包括而受到伤害。

图片

Bender 认为,ACL 应该是一个关注语言技术的场所,一个促进跨学科研究的社区,一个关心语言群体的研究领域,并且是一个我们可以理性讨论我们研究和技术对社会影响的空间。

图片

这一观点在社交平台上引起了很大争议。

有人认为,这是一种不够包容的表现,「NLP 历史上最好的时刻发生在人们对其他学科的想法持开放态度的时候:从语言研究人员那里学习统计方法,从社会科学家那里学习如何看待世界。这些幻灯片让我觉得有些人想让我们走向封闭。」

图片

图片

还有人认为,做这种分割完全没有必要,因为二者已经有机地融合在一起。

图片

不过也有人表示理解,毕竟 AI 风头太盛,一旦某个会议被 AI 论文「承包」,其他领域的研究势必受到冷落,这将使该会议失去原本的趣味。

图片

图片

对于这个演讲传递的信号,大家也开始猜测:这是不是意味着 ACL 不欢迎 AI 论文了?

图片

对此,你怎么看?

参考链接:https://faculty.washington.edu/ebender/papers/ACL_2024_Presidential_Address.pdf

相关资讯

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本论文作者赵伟翔是哈尔滨工业大学社会计算与信息检索研究中心 2021 级直博生,导师为赵妍妍教授和秦兵教授,主要研究方向为对话系统、大语言模型对齐等。他曾以第一作者在 ACL、AAAI、I

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]徐俊东,本文第一作者。本科毕业于伦敦大学学院(UCL),硕士就读于新加坡国立大学(NUS)计算机系。主要研究方向为大语言模型的推理能力。个人主页:(LLMs)实现严谨可信的推理,新国立提出

ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了

如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。这篇论文探讨的问题是:当前语言模型本身是否可以充当世界模拟器,并正确预测动作如何改变不同的世界状态,从而避免大量手动编码的需要呢?针对这一问题,来自亚利