把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

应用
11月8日
编辑

机器之心

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

来自中科院自动化所的团队提出 FreeVS，一个全生成式的新视角合成方法。相较于仅能在记录的车辆行驶原轨迹上渲染高质量相机视角的基于场景重建的方法，FreeVS 能够作为生成引擎渲染真实场景中任意车辆行驶轨迹下的视频。FreeVS 可被直接部署于任何测试场景，而无需负担通常耗时 2-3 小时的场景重建过程。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

论文链接：https://arxiv.org/abs/2410.18079
项目主页：https://freevs24.github.io/

以生成模型合成真实场景中的相机成像

现有驾驶场景中的新视角合成方法多遵循「场景重建 – 新视角渲染」的管线，依靠重建得到的 NeRF 或 3D-GS 等场景表示来渲染新视角下的成像。

然而基于重建的方法具有两大瓶颈，1）无法合理渲染缺少对应观测的新视角上的图像，2）场景重建耗时长；这使得重建方法无法高效高质地在实际数据采集轨迹之外渲染大量新相机视图。

如简单的视角左右平移即会引起前有方法图像渲染质量的严重下降：

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

与前有重建方法在原训练视角、训练视角右一米、训练视角上一米的视角合成效果对比。

对此，作者提出一种新颖的完全基于生成模型的新视角合成方法 FreeVS。作者采用一简洁有效的生成管线，可严格基于已观测到的三维场景生成任意视角的相机观测，且无需进行场景重建。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

FreeVS 方法管线。生成模型基于染色点云投影恢复相机成像。

作者采用从稀疏点云投影中恢复相机成像的生成管线，这使得生成模型的行为类似于 Inpainting 模型，基于稀疏但可靠的点云投影点补全目标图像。

在训练过程中，生成模型学习基于给定帧的三维先验生成邻近帧的相机成像。尽管训练数据中驾驶车辆在绝大多情况下走直线前行，但生成模型可沿车辆轨迹在侧向相机视角学习相机视角的横向移动。

在测试阶段，以图像信息染色的场景三维点云被投影至任意所需视角，以控制图像生成结果。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

FreeVS 方法训练数据与推理效果示例。即使训练数据中无车辆横向移动到逆行车道的例子，生成模型仍然可依靠侧向相机的训练对（（c）->（a））学习相机的侧向移动，从而生成合理的高质量成像 (f)。

车辆行驶模拟与场景编辑

以 Waymo 数据集中的真实场景为例，FreeVS 能够在驾驶车辆原本并未移动的场景模拟车辆移动：

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

能模拟车辆变线行驶，甚至能秒变 GTA，使车辆撞向行人：

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

能在原本直行的场景令车辆走大 Z 型前进：

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

也能对场景内容进行编辑。任意替换场景车辆，或定制车辆运动。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

场景编辑后相机视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

场景编辑后相机视频

与前有基于重建的方法比较，FreeVS 在新车辆运动轨迹下几乎不受图像模糊、伪影等现象困扰。把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

FreeVS 与前有方法在新轨迹模拟的表现对比。

新相机模拟

除新行驶轨迹下视角合成，FreeVS 还能合成虚拟相机位置上的成像。而前有基于重建的方法难以应对虚拟相机位置上全部观测的缺失。

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

新相机模拟示意图

把Waymo玩成GTA游戏！全生成式的车辆行驶轨迹视频合成器来了

FreeVS 与前有方法在新相机模拟的表现对比。

给TA打赏

共{{data.count}}人

人已打赏

FreeVS 中科院自动化所视角合成

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

2024-11-8 13:06:00

LeCun赞转！类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究揭秘

2024-11-8 13:29:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果
12月19日
TOP2

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物
12月19日
TOP3

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
2024年AI 编程现在可以做到什么程度？
12月18日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
12月12日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部