数据

杨立昆亲自指导开源世界大模型，为AI Agent打造超级大脑

今天凌晨，全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。与第一代相比，V-JEPA 2使用了100万视频 100万图片超大规模训练数据集，可以让AI Agent像人类那样理解真实的物理世界，为智能体打造一个“超级大脑”自主学会观察、规划到执行全自动化能力。值得一提的是，图灵奖获得者、Meta首席科学家杨立昆（Yann LeCun）参与了该模型的开发，这在Meta开源的众多大模型中很罕见。

6/12/2025 9:12:00 AM

端到端GUI智能体首次实现“犯错-反思-修正”闭环，模拟人类认知全过程

端到端多模态GUI智能体有了“自我反思”能力！南洋理工大学MMLab团队提出框架GUI-Reflection。随着多模态大模型的发展，端到端GUI智能体在手机、电脑等设备上的自动化任务中展示出巨大潜力。

6/12/2025 8:58:00 AM

10%训练数据超越100%表现，机器人学习领域迎来重要突破

第一作者陈昌和是美国密歇根大学的研究生，师从 Nima Fazeli 教授，研究方向包括基础模型、机器人学习与具身人工智能，专注于机器人操控、物理交互与控制优化。第二作者徐晓豪是美国密歇根大学机器人学院博士生，研究涵盖3D 感知、视觉语言模型驱动的多模态异常检测及鲁棒三维重建。共同第一作者 Quantao Yang 是瑞典皇家理工学院博士后，师从 Olov Andersson 教授，研究聚焦于利用视觉语言模型与大型语言模型提升自主系统在动态环境中的感知与导航能力。

6/11/2025 2:45:26 PM

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

给大模型当老师，让它一步步按你的想法做数据分析，有多难？结果是，连Claude-3.7和Gemini-2.5 Pro这样的顶尖选手，都开始“不听话”了。在一个全新的测试基准中，它们面对多轮、不断演进的指令，最终的任务成功率最高仅有40%。

6/11/2025 9:08:00 AM

0.5B以小搏大拿下端侧模型新SOTA：4090可跑，长文本处理5倍常规加速丨清华&面壁开源

端侧性价比之王，清华大学和面壁智能团队开源新模型——MiniCPM 4，提供8B、0.5B两种参数规模，仅使用同级别开源模型22%的训练开销，就达到了同级别最优性能。 MiniCPM4-8B是开源首个开源的原生稀疏模型，5%的极高稀疏度加持，让长文本、深思考在端侧真正跑起来。在MMLU、CEval、MATH500、HumanEval等基准测试中，以仅22%的训练开销，性能比肩 Qwen-3-8B，超越Gemma-3-12B。

6/11/2025 9:03:29 AM

大模型能够自发形成“人类思维地图”！Nature子刊重磅研究揭示多模态大模型类脑机制

大模型≠随机鹦鹉！ Nature子刊最新研究证明：大模型内部存在着类似人类对现实世界概念的理解。 LLM能理解现实世界和各种抽象概念吗？

6/10/2025 9:04:00 AM

破解自驾数据难题！毫米波雷达可控仿真技术新框架来了

以神经网络为核心引擎，让AI承担雷达仿真数据生成任务，还实现对雷达物理特性的建模与控制——这就是光轮智能联合清华AIR、LeddarTech等机构提出的全新自动驾驶神经渲染框架SA-Radar。在无需雷达具体细节的情况下，它能实现可控且逼真的雷达仿真，支持场景的灵活编辑——包括雷达属性修改、演员移除以及新视角合成，并能显著增强多种下游任务。作为高级驾驶辅助系统（ADAS）中扮演着至关重要角色的雷达，其相关研究和开发仍面临数据获取的挑战。

6/10/2025 8:45:00 AM

AI 成本直降 90%！女股神 Cathie Wood 圈定 3 条迁徙线：Robotaxi、端侧大模型、AI 医药

（视频来源：对话ARK Invest创始人Cathie Wood）北京时间 6 月 5 日，在《The Diary of a CEO》最新一期节目中，ARK Invest 创始人、掌管 300 亿美元资产的‘女股神’ Cathie Wood（凯茜·伍德），用三组数据划出 AI 落地的爆发路径：训练侧：过去两年，GPT-3 级别模型的训练成本从 460 万美元跌到 45 万美元，年降幅约 70%，堪称“断崖式”跳水；应用侧：ARK 测算 Robotaxi 单英里成本可低至 0.25 美元，比现有网约车便宜近 90%；消费侧：AI 代理激发的新消费行为，2030 年线上支出或达 9 万亿美元，改写全球最大产业链的资金流。在同一天，特朗普在 Truth Social 威胁“取消特斯拉全部政府合同”，引发政商关系骤然紧张。但 Cathie Wood 的判断更冷静、更本质：“Robotaxi 的成败，关键不是谁在互呛，而是成本模型能不能跑通。

6/9/2025 5:32:09 PM

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），实现超长文本的高效上下文建模。在 128K 超长序列上下文建模任务中，CCA-Attention 的推理速度是标准自注意力机制的 7.9 倍，同时键值缓存（KV Cache）显存占用减少 93%，性能全面优于现有高效注意力方法。论文标题：Core Context Aware Transformers for Long Context Language Modeling论文链接：：：2024年12月17日该成果已被 ICML 2025 接收，最早于 2024 年 12 月 17 日提交至 ArXiv，早于 DeepSeek NSA 和 Kimi MoBA 公开。

6/9/2025 9:23:05 AM

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

LLM苦算力太久了！为缓解长序列建模中的算力瓶颈，研究界持续探索高效替代方案。这次Mamba作者Tri Dao、华人AI领域大牛Eric P.

6/9/2025 9:05:00 AM

八个数据集全面胜出！思维链推理刷新图学习表现上限

思维链提示学习来了！由于图数据拥有复杂的非线性结构和缺少文本信息，语言模型中的思维链（Chain-of-Thought，CoT）提示学习方法难以简单直接地应用于图数据。基于此，来自新加坡管理大学和中国科学技术大学的研究者们提出了GCoT——首个应用于无文本图数据的类思维链提示学习框架。

6/9/2025 8:37:00 AM

你永远叫不醒装睡的大模型！多轮对话全军覆没，性能暴跌39%

ChatGPT将大模型技术推动到「对话」场景，直接引发了AI技术的爆炸式增长。用户可以先提出一个粗糙的、不明确的问题，再根据模型的回答逐步完善指令、补充细节，多轮对话也催生出「跟AI打电话」等有趣的应用设计。不过，现有的大模型性能评估基准仍然是基于单轮对话机制，输入的指令也更长，信息更完善，其在真实场景中多轮对话的性能仍然没有得到很好地评估。

6/9/2025 8:30:00 AM

精准调控大模型生成与推理！浙大&腾讯新方法尝试为其注入“行为定向剂”

如果你面前有两个AI助手：一个能力超强却总爱“离经叛道”，另一个规规矩矩却经常“答非所问”，你会怎么选？这正是当前大模型控制面临的两难困境：要么模型聪明却难以约束，要么守规矩却缺乏实用性。但我们真正追求的，并不是在“聪明但难控”与“听话但愚钝”之间二选一，而是打造既强又好的AI助手——既具备强大的智能能力，又能始终按照人类意图行事。

6/6/2025 9:15:00 AM