ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了

你被拒了吗?ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。在机器学习社区中,ICLR 是较为「年轻」的学术顶会,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2013 年才举办了第一届。不过 ICLR 很快获得学术研究者们的广泛认可,被认为是深度学习顶会。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。今日,ICLR 2024

你被拒了吗?

ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。

在机器学习社区中,ICLR 是较为「年轻」的学术顶会,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2013 年才举办了第一届。不过 ICLR 很快获得学术研究者们的广泛认可,被认为是深度学习顶会。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。

今日,ICLR 2024 将录用结果陆续通知了论文提交者。本届会议共收到了 7262 篇提交论文,整体接收率约为 31%,与去年持平(31.8%)。此外 Spotlights 论文比例为 5%,Oral 论文比例为 1.2%。

图片

研究分析网站 Paper Copilot 对 ICLR 2024 的接收论文做了非常详细的统计,并提供了与往年直观的比较。

图片

网站地址:https://papercopilot.com/statistics/iclr-statistics/iclr-2024-statistics/

结果出来后,依然是几家欢喜几家愁,论文被接收的学者纷纷「晒出」自己的喜悦。

机器之心报道过的苹果文生图大模型收到了被接收的喜讯。在这篇论文中,研究者提出了俄罗斯套娃式扩散模型(Matryoshka Diffusion Models,MDM),用于端到端高分辨率图像生成。

图片

推特 @thoma_gu

知名 AI 学者、Meta AI 研究科学家田渊栋团队有 4 篇论文被接收,其中包括了一篇 Spotlight 论文。

图片

推特 @tydsh

新加坡国立大学校长青年教授尤洋团队的论文《InfoBatch: Lossless Training Speed Up by Unbiased Dynamic Data Pruning》被接收为了 Oral。

图片

推特 @YangYou1991

不过,有些论文似乎成了 ICLR 2024 的遗珠,比如清华大学交叉信息研究院的研究者推出的 LCM(Latent Consistency Models),它将主流文生图模型的效率提高了 5 到 10 倍,甚至做到了实时连续生图。该模型发布仅仅一个月后便浏览超百万,在 Hugging Face 平台的模型下载量超 20 万。

图片

论文共同一作 Simian Luo 感叹这是「这辈子最好笑的笑话」。

我们找到了一位审稿人的意见,他指出论文的缺点有这些:没说清楚哪些贡献对效率和质量影响最大、没给出求解增强 PF-ODE 的计算复杂度、没说明与其他方法相比推理时间到底快了多少、 没给到 LCM 除用于 Stable Diffusion 以外其他 LDMs 的性能如何?

图片

图源:https://openreview.net/forum?id=duBCwjb68o

机器之心的各位读者,你们提交的论文中了吗?

欢迎中了的小伙伴向机器之心投稿。投稿邮箱:[email protected]

相关资讯

ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3

动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快手和北大合作的最新多模态大模型 LaVIT, 正在让这个想法逐步变为现实。论文标题:Unified Language-Vision Pretraining in LLM wi

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。大型语言模型(LLM)通常拥有数十亿的参数,用了数万亿 token 的数据进行训练,这样的模型训练、部署成本都非常高。因此,人们经常用各种模型压缩技术来减少它们的计算需求。一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝和量化。其中,剪枝方法已经存在了一段时间,但许多方法需要在剪枝后进行恢复微调(RFT)以保持

ICLR 2024 | 单图三维重建数字虚拟人,浙大&字节提出Real3D-Portrait算法

近期虚拟人方面的应用如同雨后春笋一般涌现出来。你是否在很多 App 中,看到了 AIGC 让单张照片开口说话的能力?尽管已经能够拥有清晰的画质和准确的口型,但现有的单图驱动虚拟人似乎还差了一点:呈现的结果中说话人往往采用和原图中说话人接近的头部姿态,无法像真人一样在画面中自由地运动。这是因为目前采用的技术无法对图片中说话人在 3D 世界中进行建模,因此在大姿态驱动的情况下会出现效果急剧下降的问题。单图 3D 说话人视频合成 (One-shot 3D Talking Face Generation) 可以被视作解决这