重新思考轨迹预测 | 复旦提出PIFM：如何将规划引入预测？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 && 笔者理解传统的自动驾驶主要可以分为感知、预测、规控三个大的部分，其中预测模块承担着十分重要的角色，为下游规划路径提供重要的信息。然而，现实世界驾驶环境的复杂性，其中包括多个动态智能体（如车辆和行人）之间的相互作用，给预测造成了不小的挑战。

本文经自动驾驶之心公众号授权转载，转载请联系出处。

写在前面 && 笔者理解

传统的自动驾驶主要可以分为感知、预测、规控三个大的部分，其中预测模块承担着十分重要的角色，为下游规划路径提供重要的信息。然而，现实世界驾驶环境的复杂性，其中包括多个动态智能体（如车辆和行人）之间的相互作用，给预测造成了不小的挑战。这其中有一个重要任务就是轨迹预测，这涉及到基于它们当前的状态和环境来预测周围智能体的未来移动。

传统上，运动预测模型预测单个智能体的轨迹，而没有考虑它们之间的相互依赖性。在多智能体环境中，这种方法会导致次优的预测，因为它并不能捕捉到智能体之间的复杂交互。为了克服这些限制，最近的工作开始将规划信息纳入轨迹预测过程，允许系统做出更明智的决策。

论文链接：https://arxiv.org/pdf/2410.19639

在过去几年，自动驾驶的轨迹预测也有了显著的发展，许多方法利用多模态融合技术来提高准确性。比较早期模型依赖于历史轨迹和地图数据，通常将这些输入结合起来做预测。近期的工作会使用基于transformer的架构，引入了注意力机制以更好地整合这些不同的模态。这些模型大大提高了自动驾驶系统的预测能力，尤其是在智能体与其环境动态交互的场景中。另外，Planning-aware模型也作为提高轨迹预测的有效方法之一，比如：PiP和PRIME明确地将规划信息集成到预测框架中，允许系统在轨迹生成过程中考虑未来的目标。然而，这些方法通常因为处理数据所涉及的计算复杂性，在实时多智能体场景中表现并不理想。因此，基于扩散的模型最近被提出来解决这些问题，同时减少计算负担，同时保持高预测性能。

在这项工作中，作者提出了轨迹信息规划扩散（Trajectory-Informed Planning Diffusion，TIP-D）模型，该模型基于扩散框架的优势，并直接将规划特征集成到运动预测过程中，目的是结合规划信息来提高轨迹预测的准确性和可解释性。作者的方法能够通过利用交叉注意力机制动态融合规划特征与环境数据，同时预测多个智能体的轨迹。此外，TIP-D模型在计算复杂性上实现了显著降低，与现有的最先进方法相比降低了80%以上，同时在复杂的多智能体驾驶场景中保持了高准确性。