Meta首席AI科学家LeCun 的新研究:AI 仅需观看视频即可掌握物理规律

近日,Meta 的 AI 首席科学家 Yann LeCun 领导的一项研究揭示了人工智能如何通过观看视频来培养基本的物理学理解。 这项研究由 Meta FAIR、巴黎大学及 EHESS 的科学家们共同完成,显示出 AI 系统能够在没有预设规则的情况下,通过自我监督学习获得直观的物理知识。 研究团队采用了一种名为视频联合嵌入预测架构(V-JEPA)的新方法,与 OpenAI 的 Sora 等生成型 AI 模型相比,V-JEPA 的工作原理更接近人脑的信息处理方式。

近日,Meta 的 AI 首席科学家 Yann LeCun 领导的一项研究揭示了人工智能如何通过观看视频来培养基本的物理学理解。这项研究由 Meta FAIR、巴黎大学及 EHESS 的科学家们共同完成,显示出 AI 系统能够在没有预设规则的情况下,通过自我监督学习获得直观的物理知识。

QQ_1739931962266.png

研究团队采用了一种名为视频联合嵌入预测架构(V-JEPA)的新方法,与 OpenAI 的 Sora 等生成型 AI 模型相比,V-JEPA 的工作原理更接近人脑的信息处理方式。V-JEPA 并不追求生成完美的像素预测,而是专注于在一个抽象的表示空间中进行预测。通过这种方式,AI 系统能够学习到基本的物理概念。

研究中,团队借用了来自发展心理学的 “期望违反” 评估方法,该方法最初用于测试婴儿的物理理解能力。研究者展示给 AI 两个相似的场景 —— 一个是物理上可能的,另一个是物理上不可能的(例如,一只球穿过墙壁),通过测量对这些物理违背现象的反应,可以评估 AI 的物理理解能力。

V-JEPA 在三个数据集上进行了测试:IntPhys(基本物理概念)、GRASP(复杂交互)和 InfLevel(现实环境)。结果显示,V-JEPA 在物体恒常性、连续性和形状一致性方面表现尤为出色,而诸如 Gemini1.5Pro 和 Qwen2-VL-72B 等大型多模态语言模型的表现几乎与随机猜测相当。

V-JEPA 学习的效率也引人注目,该系统只需观看128小时的视频,就能够掌握基本的物理概念。而且,连115百万参数的小型模型也展现出强劲的效果。研究表明,V-JEPA 能够有效识别运动模式,并以高准确率识别物理上不合理的事件,这为 AI 真正理解世界的未来奠定了基础。

这项研究挑战了许多 AI 研究中的一个基本假设,即系统需要预设的 “核心知识” 以理解物理法则。V-JEPA 的发现表明,观察学习能够帮助 AI 获得这方面的知识,类似于婴儿、灵长类动物甚至年轻鸟类理解物理的过程。研究符合 Meta 对 JEPA 架构的长期探索目标,旨在创建全面的世界模型,使自主 AI 系统能够更深入地理解其环境。

划重点:  

🧠 研究显示 AI 通过视频学习物理知识,无需预设规则。  

📊 V-JEPA 在理解物理方面优于大型语言模型,表现出更强的学习能力。  

🌍 Meta 推动新的 AI 发展方向,旨在创建更全面的环境理解模型。  

相关资讯

Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓

虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR 操作系统整合者的 Meta 对元宇宙开放的新愿景。至此,Meta 正式向实现元宇宙更开放的计算平台愿景迈出下一步。为实现该恢弘战略,Meta 同时在三方面不断发力,并竭力整合资源:向第三方硬件制造商开放 Meta Quest 设备的操作系统,为消费者

不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?

3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 」DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。 最先陷入恐慌的,似乎是同样推崇开源的 Meta。