昨日,小鹏汽车在香港举办AI技术分享会,首次公布正在研发的720亿参数超大规模自动驾驶大模型——“小鹏世界基座模型”。该模型以多模态架构为核心,融合视觉理解、链式推理及动作生成能力,旨在通过云端蒸馏技术部署至车端,并同步赋能AI机器人、飞行汽车等生态产品。
据小鹏汽车自动驾驶负责人李力耘介绍,基座模型以大语言模型为骨干,采用海量驾驶数据训练,具备自我进化能力。通过强化学习机制,模型将持续提升决策效率,目标实现超越人类驾驶水平的自动驾驶技术。为支撑这一研发,小鹏汽车自2023年起加速布局AI基础设施,现已建成国内汽车行业首个万卡智算集群,算力规模达10EFLOPS,集群利用率长期稳定在90%以上,峰值效率突破98%。
小鹏汽车将这套从云端训练到车端部署的全链路流程命名为“云端模型工厂”,涵盖预训练、后训练、模型蒸馏及车端适配等环节。目前,该工厂已实现平均5天一次的全链路迭代,视频训练数据量从2000万clips增至今年目标的2亿clips。研发团队还开发了多尺寸基座模型,其中720亿参数的72B模型参数量达主流VLA模型的35倍,标志着小鹏在自动驾驶算力储备上取得突破性进展。
技术路径上,小鹏汽车通过“云端模型工厂”打通数据闭环:基座模型在云端完成预训练与强化学习后,经蒸馏压缩为轻量化版本,最终部署至车端。这一架构不仅支持现有车型的智能化升级,还将为AI机器人、飞行汽车等前沿产品提供底层能力。
官方透露,小鹏汽车自2024年启动AI基础设施(AI Infra)建设,现已形成覆盖数据采集、模型训练到场景落地的完整体系。三大阶段性成果已初步显现:验证规模法则在自动驾驶领域的持续有效性、在后装算力车端实现基座模型控车、启动72B参数模型训练并搭建强化学习专用框架。未来,小鹏世界基座模型将深度整合至AI生态,推动智能汽车与机器人技术的协同进化。