大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Workshop主页:,多模态基础模型(MFM),例如 CLIP、ImageBind、DALL・E 3、GPT-4V、Gemini 和 Sora,已成为人工智能领域最引人注目且发展迅速的领域之一。同时,MFM 的开源社区也涌现出了诸如 LLaVA、LAMM、MiniGPT-4、Stable Diffusion 和 OpenSora 等具有代表性的开源项目。不同于传统计算机视觉和自然语言处理模型,这类 MFM 正在积极探索通用问题解决方案。通过引入 MFM,具身智能(EAI)能够在模拟器和现实世界环境中更好地处理各种

大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Workshop主页:https://icml-mfm-eai.github.io/

概述

近年来,多模态基础模型(MFM),例如 CLIP、ImageBind、DALL・E 3、GPT-4V、Gemini 和 Sora,已成为人工智能领域最引人注目且发展迅速的领域之一。同时,MFM 的开源社区也涌现出了诸如 LLaVA、LAMM、MiniGPT-4、Stable Diffusion 和 OpenSora 等具有代表性的开源项目。

不同于传统计算机视觉和自然语言处理模型,这类 MFM 正在积极探索通用问题解决方案。通过引入 MFM,具身智能(EAI)能够在模拟器和现实世界环境中更好地处理各种复杂任务。然而,在 MFM 和 EAI 的交叉领域,仍有许多尚未探讨和解决的问题,包括智能体长期决策、智能体运动规划、新环境泛化能力等。

本次 Workshop 将致力于探讨几个关键问题,包括但不限于:

MFM 的泛化能力;

用于具身智能的 MFM;

基于生成模型的世界模型;

模仿学习数据收集。

Workshop 征稿

该 workshop 聚焦于多模态基础模型(MFM)、具身智能(EAI)以及两项研究的交叉领域。本次征稿主题包括但不限于:

Training and evaluation of MFM in open-ended scenarios

Data collection for training embodied Agents

Framework designs for MFM-powered embodied agents

Perception and high-level planning in embodied agents empowered by MFM

Decision-making and low-level control in embodied agents empowered by MFM

Evaluation of the capability of embodied agents

Generative model as world simulator

Limitations of MFM in empowering EAI

投稿规则

本次投稿将通过 OpenReview 平台实行双盲审稿。投稿的正文篇幅为 4 页,参考文献和补充材料篇幅不限。

投稿格式和模板遵循 ICML 2024 投稿指南:https://icml.cc/Conferences/2024/CallForPapers

投稿入口:https://openreview.net/group?id=ICML.cc/2024/Workshop/MFM-EAI

时间节点

所有时间节点均为 [AoE] (Anywhere on Earth)。

大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

MFM-EAI 挑战赛

三个赛道(可以同时参与)

EgoPlan 挑战

EgoPlan 挑战赛致力于评估多模态大模型在复杂的现实世界场景中,针对人类日常活动所涉及的真实任务的规划能力。在比赛中,模型需要依据开放式的任务目标描述、第一人称视角下的任务进度视频和当前环境观察,从多样化的动作候选集合中选择出最合理的下一步,以有效推进任务的完成。

比赛官网:https://chenyi99.github.io/ego_plan_challenge/

即日起 - 2024 年 7 月 1 日  通过填写 [Google 表单]报名参赛(https://docs.google.com/forms/d/e/1FAIpQLScnWoXjZcwaagozP3jXnzdSEXX3r2tgXbqO6JWP_lr_fdnpQw/viewform?usp=sf_link)

奖项设置

冠军:800 美元

亚军:600 美元

创新奖:600 美元

Composable Generalization Agent 挑战

Composable generalization 挑战赛致力于评估由多模态大模型进行规划、low-level 控制器进行执行的组合系统在开放场景下的任务规划能力、任务执行能力和对 novel 场景、物体和技能的泛化能力。在比赛中,模型会根据语言形式的任务描述、多模态视觉输入(RGB 图片 + 深度图片),对任务进行拆解,并由控制器完成对拆解后子任务的执行。

更多信息将于 7 月公布

World Model 挑战

World Model 挑战赛致力于评估 world simulator 在多种具身智能场景(机械臂,自动驾驶,Minecraft 等)中的应用表现。在比赛中,模型需要在不同具身智能场景下根据具身任务的描述以及实时场景观测生成一段符合任务指令的视频,评估将从:1)具身角度评价视频生成质量;2)视频指导 agent 产生控制信号完成任务两个角度进行。

更多信息将于 7 月公布

委员会成员

Workshop组织者

大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

指导委员会

大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

联系方式

Workshop 相关问题

[email protected]

相关资讯

ICCV 2021 Anti-UAV Workshop & Challenge征稿啦,第二届“无人机跟踪”挑战赛等你来战!

作为计算机视觉领域的三大国际顶级会议之一,CCF A类国际会议ICCV 2021(IEEE International Conference on Computer Vision)将于2021年10月11-17日在线举办。近日,ICCV官方网站公布了Workshop Proposal的最终收录结果(),各式各样的Workshop和挑战赛已相继启动。其中,“全华班”AI 学者组织的The 2nd Anti-UAV Workshop & Challenge()尤为亮眼,该Workshop由北京理工大学、北京邮电大学、哈

把一个脑洞发展成1场顶会Workshop,阿里妈妈只用了1年|直击NeurIPS'24

学术打野NeurIPS 2024,好多人啊(发出周迅的声音)! 最热闹最值得回味的,咱都总结好了:学术追星:和Ilya、FeiFei、Kaiming、Saining拘谨但不失礼貌地合照。 现场开吃:分为吃瓜Bengio和OpenAI员工吵起来版 & “学术蝗虫”狂炫会上的饭和下午茶版。

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。