新赛题:七大赛道,赛题新颖,全方位覆盖相关领域最新最热话题,充分挖掘大模型在主动驾驭及具身智能垂直领域中的应用。高奖金:总奖金池超过12万美金,单赛道最高奖金可达2.7万美金。据不完全统计,奖金额度在CVPR 2024百个论坛中最高。重原创:加强基础研究探索,坚持四个面向。以原创性与科学研究价值作为主要衡量指标,并不单靠成绩排名。采取原创方案加性能指标两者结合的方式进行综合排序。
2024年3月1号,2024国际主动驾驭挑战赛正式启动。本次挑战赛由上海人工智能实验室主办,并联合多家国内外机构共同举办。多位国内外知名专家学者组成赛事指导与评奖委员会。本赛事旨在深入探讨自主系统面临的任务和挑战,为全球参赛者提供展示技术与创新的舞台。在本次大赛中,我们对参赛者不设置过多的限制,如允许同一机构多个队伍参赛,允许使用所有公开数据集及预训练权重,允许一个队伍同时获得多个奖项等。本次比赛共设七个赛道,获胜者有机会获得高达两万七千美金奖励,还有机会被邀请在国际顶级期刊进行投稿。我们还为每个赛道准备了详细的参赛指引及基准模型,点击每个赛道对应链接即可访问。
比赛官网:
https://opendrivelab.com/challenge2024
主活动:
CVPR 2024论坛 – Workshop on Foundation Models for Autonomous Systems (Seattle, USA)
相关活动:
四月下旬:第三届中国三维视觉大会(China3DV 2024)http://www.csig3dv.net/2024/competition.html六月中旬:线下活动(北京/上海)
赛题介绍端到端主动驾驭
由于先前数据集规模有限、开环和闭环指标不一致等原因,导致难以使用真实数据对感觉运动驱动策略进行基准尝试。此赛道中,将使用大规模数据弥合两种评估范式之间的差距,并通过在短时序范围内的BEV抽象建模,实现高效开环评测,同时更好地与闭环评估保持一致。
赛道信息:https://opendrivelab.com/challenge2024/#end_to_end_driving_at_scale数据量:约2T尝试服务器:https://huggingface.co/spaces/AGC2024-P/e2e-driving-2024
世界模型
作为现实的抽象时空表征,世界模型可根据观测到的当前状态猜测未来状态,对世界模型的学习将促进基础模型性能提升至新水平。模型需要在只有视觉输出的情况下,猜测出未来时刻的点云,以证明其对世界的猜测能力。
赛道信息:https://opendrivelab.com/challenge2024/#predictive_world_model数据量:约2T参照训练时间:样本数据上,8卡A100,3天尝试服务器:https://huggingface.co/spaces/AGC2024-P/predictive-world-model-2024
占据栅格和运动估计
三维框往往不足以描述一般物体,受机器人学概念的启发,可将感知表征描述成对栅格化三维空间的占据情况猜测。在这个赛道中,参赛者不仅要给出三维空间的栅格化表示,还须给出栅格的运动猜测。
赛道信息:https://opendrivelab.com/challenge2024/#occupancy_and_flow主动驾驭挑战赛@China3DV :https://huggingface.co/spaces/China3DV-S/occupancy-and-flow-2024数据量:约70GB参照训练时间:8卡 3090,2天尝试服务器:https://huggingface.co/spaces/AGC2024-S/occupancy-and-flow-2024
具身多模态三维视觉定位
相比驾驭场景,室内的具身三维感知系统面对的是包含说话指令的多模态输出、更复杂的语义理解、更多样的物体类别和朝向,以及大不相同的感知空间和需求。基于此,大赛构造了一套第一视角的多模态全场景三维感知工具包 EmbodiedScan。这项任务的目标是:给定关于特定物体的说话描述,检测出目标物体的类别以及带朝向的三维框。
赛道信息:https://opendrivelab.com/challenge2024/#multiview_3d_visual_grounding数据量:约 1.5T参照训练时间:样本数据 8 卡 A100 0.5天,全量数据 8 卡 A100 3天尝试服务器:https://huggingface.co/spaces/AGC2024/visual-grounding-2024
CARLA主动驾驭挑战赛
CARLA主动驾驭挑战要求车辆通过一组预先定义的路线。车辆行驶路线中涉及复杂的情况,如高速公路、城区、住宅区和乡村等环境,同时包含日光、日落、夜晚以及雨、雾等光照和天气,为主动驾驭系统的闭环评测提供了可能。
赛道信息:https://opendrivelab.com/challenge2024/#carla尝试服务器:https://eval.ai/web/challenges/challenge-page/2098/overview
大说话模型在主动驾驭中的应用
通过引入说话信息,DriveLM数据集将大说话模型与主动驾驭系统连接起来,并最终通过引入说话的推理能力做出决策,确保规划的可解释性。以多视角图像为输出信息,模型须回答涉及驾驭的多方面问题。
赛道信息:https://opendrivelab.com/challenge2024/#driving_with_language数据量:训练集4072帧,尝试集799帧,每帧约90个问答对参照训练时间:8卡V100,1天尝试服务器:https://huggingface.co/spaces/AGC2024/driving-with-language-2024
无图驾驭
在没有高清地图的情况下,主动驾驭汽车需要高水平的场景理解能力,本赛道旨在探索场景推理能力的极限。将多视角图像和标清地图作为输出信息,神经网络不仅要输出车道和交通元素的感知结果,同时还须输出车道之间、车道和交通元素之间的拓扑关系。
赛道信息:https://opendrivelab.com/challenge2024/#mapless_driving主动驾驭挑战赛@China3DV :https://huggingface.co/spaces/China3DV/mapless-driving-2024数据量:约200G参照训练时间:8卡V100,1天尝试服务器:https://huggingface.co/spaces/AGC2024/mapless-driving-2024
赛程安排
以下时间均为北京时间,详情请参照大赛官方网站。
即日起-2024年6月1日:参赛报名2024年3月1日:比赛正式开始2024年3月25日:尝试服务器开放2024年6月1日:尝试服务器关闭2024年6月18日:比赛结果公布
指导与评奖委员会
按照姓名笔画排序;名单持续更新中。
乔宇
上海人工智能实验室
领军科学家,主任助理
刘青山
南京邮电大学
副校长
杨小康
上海交通大学
人工智能研究院执行院长
李升波
清华大学
车辆学院党委书记,国家高层次领军人才,熏陶
张亚勤
清华大学
中国工程院外籍院士,智能产业研究院院长,讲席熏陶
陈宝权
北京大学
智能学院副院长,博雅特聘熏陶
夏华夏
美团
首席科学家,副总裁
高新波
重庆邮电大学
党委副书记,校长,熏陶
薛建儒
西安交通大学
熏陶
点击“阅读原文”或访问以下链接即可了解详情
https://opendrivelab.com/challenge2024
微信交流群
关于我们 -> 加入社群
报名链接
联系邮箱