为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

人经常走一条路能走熟,自动驾驶汽车也应该能。

自动驾驶汽车靠各种传感器「看到」这个世界,然后再借助人工神经网络处理来自传感器的数据。它们和人类不同,因为人类是有记忆的,一条路多走几次就熟了,但对于使用人工神经网络的自动驾驶汽车来说,这条路每天都是新的。这在天气恶劣时会成为一个问题,因为这种天气下,传感器往往没有那么可靠。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

为了缓解这一问题,来自康奈尔大学 Ann S. Bowers 计算机与信息科学学院和工程学院的研究人员在 CVPR 2022 上发表了两篇研究论文,在ICLR 22上发表了一篇论文,其核心思想是为自动驾驶汽车创造「记忆」,并在后续的行驶中使用这些记忆。

论文 1 标题为「HINDSIGHT is 20/20: Leveraging Past Traversals to Aid 3D Perception」,一作是博士生游宇榕(Yurong You),senior author 是康奈尔大学 Bowers CIS 计算机科学教授 Kilian Weinberger。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

论文链接:https://arxiv.org/pdf/2203.11405.pdf

Weinberger 教授认为,「上述问题的核心在于,我们能否从反复的经历中学习?例如,汽车的激光扫描仪第一次从远处看到形状奇怪的树时,可能会把它误认为行人,但一旦距离足够近,物体类别就变得清晰起来。因此,当你第二次开车经过同一棵树时,即使是在雾中或雪中,你也希望汽车已经学会正确识别这棵树。」

「事实上,你很少有机会开上一条近期完全没人开过的路,总有人最近会经过这里,所以,收集经验并加以利用看起来是再正常不过的事。」论文合著者 Katie Luo 说到。

在博士生 Carlos Diaz-Ruiz 的带领下,该小组在 18 个月的时间里驾驶一辆配置了激光雷达传感器的汽车在伊萨卡及其周围的 15 公里环路上重复行驶了 40 次,收集了沿途的环境(高速公路、城市、校园)、天气(晴天、雨天、下雪天)和一天中不同时段的信息。

这些信息组成了一个名为「Ithaca365」的数据集,其详细信息可在论文 2《Ithaca365: Dataset and Driving Perception under Repeated and Challenging Weather Conditions》中找到。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Diaz-Ruiz_Ithaca365_Dataset_and_Driving_Perception_Under_Repeated_and_Challenging_Weather_CVPR_2022_paper.pdf

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

「这项研究直面自动驾驶汽车的一项关键挑战——恶劣的天气条件,」Ithaca365 的合著者 Diaz-Ruiz 说,「如果路面被积雪覆盖,人类可以依靠记忆,但人工神经网络无法依靠记忆,这就使其陷入劣势。」

论文 1 标题中的「HINDSIGHT」是一种在汽车经过物体时使用神经网络计算物体描述符的方法。然后,它会压缩这些被称为「SQuaSH (Spatial-Quantized Sparse History) 特征」的描述,并将其存储在虚拟地图上,类似于存储于人脑中的「记忆」。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

下次穿越同一位置时,自动驾驶汽车可以查询沿途每个激光雷达点的本地 SQuaSH 数据库,并「回忆起」上次学习的内容。该数据库不断更新并在车辆间共享,从而丰富了可用于执行识别的信息。

「此信息可作为特征添加到任何基于激光雷达的 3D 目标检测器中,」游宇榕说,「检测器和 SQuaSH 表示可以在没有任何额外监督或人工注释的情况下被联合训练,后者需要花费不少时间和精力。」

虽然 HINDSIGHT 仍然假设人工神经网络已经经过训练,可以检测物体,并增加了创建记忆的能力,但论文 3《Learning to Detect Mobile Objects from LiDAR Scans Without Labels》又往前走了一步,提出了一种名为 MODEST(Mobile Object Detection with Ephemerality and Self-Training)的方法。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/You_Learning_To_Detect_Mobile_Objects_From_LiDAR_Scans_Without_Labels_CVPR_2022_paper.pdf

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

在这篇论文中,作者让自动驾驶汽车从头开始学习整个感知流程。最初,车辆中的人工神经网络从未接触过任何物体或街道。在对同一路径多次遍历之后,它可以了解到环境的哪些部分是静止的,哪些目标是移动的。慢慢地,它会教会自己什么是其他交通参与者,什么是可以忽略的安全因素。

然后,该算法可以可靠地检测这些目标,甚至在最初的重复遍历中不包括的道路上。

研究人员希望这两种方法都能大幅降低自动驾驶汽车的开发成本(目前仍严重依赖昂贵的人工标注数据),并通过学会在最常用的地点导航来提高这种汽车的效率。

论文 1 和论文 3 的一作均为康奈尔大学博士生游宇榕(他也参与了论文 2)。他本科毕业于上海交通大学致远学院 ACM 班,大二暑假加入卢策吾的实验室开始了对计算机视觉和增强学习的研究,并分别在大三暑假赴斯坦福大学 AI 实验室,大四暑假赴康奈尔大学进行相关领域的科研实习,之后获得康奈尔大学、加州理工学院计算机科学博士全奖录取。

最终,他选择了康奈尔大学攻读博士,师从该校计算机科学教授 Kilian Q. Weinberger 和计算机科学助理教授 Bharath Hariharan,重点研究计算机科学、机器学习等方向。

为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生两篇论文被CVPR 2022收录

参考链接:https://news.cornell.edu/stories/2022/06/technology-helps-self-driving-cars-learn-own-memories

https://news.sjtu.edu.cn/ztzl_qczj/20180628/78193.html

相关资讯

不分割成token,直接从字节中高效学习,Mamba原来还能这样用

给出一句「Hello, world!」你要怎么把它喂给 AI 模型?目前常见的方法是利用某种算法将它分为若干 token,比如 ["Hello", ",", "world", "!"]。模型通过学习这些 token 的上下文关系以及如何组合它们来表示原始文本或预测下一个 token。但这种方法依赖于有效的 token 分割算法,而且可能无法很好地处理新词、专有名词或非标准用法。因此,不少研究者也在尝试另一种方法:直接让模型从字节中学习。在 Mamba 问世之后,这条路似乎有希望了。在定义语言模型时,通常会使用一种基

如何实现数据高效管理并反哺赋能业务?这场自动驾驶闭门会要聊点实的

随着自动驾驶向着高阶迭代,汽车的定位由交通工具转向“智能移动终端 第三空间”,车企及自动驾驶企业的核心竞争力转向软件及服务能力。伴随汽车数智升级而来的是数据体量和算力需求的指数级增长,要真正应对智能网联趋势下的技术瓶颈和业务赋能挑战,建立一套贯穿数据应用和管理全流程的有机数据闭环,在汽车全生命周期内最大程度挖掘数据价值至关重要。为快速打造基础设施、打通数据闭环,车企纷纷开启上云进程。在后续汽车数智化军备竞赛中,如何高效完成数据从工具到核心资产、数据应用管理从基础能力进阶竞争壁垒的转变,并实现降本增效,云服务能力

小鹏P5上海车展正式开启预订,载人飞行器同台亮相

2021年4月19日,小鹏汽车携旗下第三款产品,全球首款搭载激光雷达的量产智能汽车——小鹏P5亮相2021上海车展,并举办以“天生智能 探索不止”为主题的新闻发布会。小鹏汽车董事长 CEO何小鹏与所有到场嘉宾一起分享如何让智能汽车更好地改变我们的出行生活,并宣布小鹏P5正式开启预订。2021上海车展小鹏汽车展台汽车董事长 CEO何小鹏在发布会现场,何小鹏表示:“我们始终在探索未来智能出行的可能性,无论是小鹏P5,还是旅航者X1,都是我们阶段性思考出来的产品,我们希望未来的出行生活能越来越智能,越来越便利”。智能基因