理论 - AI在线

Grok 3疯狂实测，满屏都是马斯克！3D乒乓球破屏，火星殖民实时播报

各位坐稳了，AI的世界开始变得疯狂起来了！自从上周马斯克发布Grok 3以来，其热度一直不减。它可不仅仅是另一个聊天机器人，这家伙正在扭曲现实！

DeepSeek“出圈”了，鹅厂人怎么看？

话题背景在人工智能领域，大型语言模型的快速发展引发了无数关于技术革新和未来趋势的讨论。随着各类AI技术的不断突破，越来越多的创新模型开始崭露头角，而最近备受关注的DeepSeek更是成为了热议的焦点。它被一些人称为“AI技术的重大突破”，甚至被认为是下一代人工智能发展的重要方向。

Claude 3.7登顶编程竞技场，大幅领先100分！最新布料模拟实测再惊艳网友

公认的编程开发能力第一！ Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。大幅甩第二名100多分，在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。

任意Prompt就能给大模型实时排名！竞技场新玩法，还能自动找最佳AI来作答

给大模型排名这事儿，现在有了新玩法——任意输入一个Prompt，就能给大模型们实时排名，精准找到最适合做这个Prompt的大模型！这就是竞技场（lmarena.ai）最新推出的排名方式，叫做Prompt-to-leaderboard（P2L）。主打的就是找到最能直击你Prompt“灵魂”的那款大模型。

3500元，人形机器人1:1复刻人类动作 | 上海AI Lab开源新成果

《环太平洋》名场面之“用真人操纵机甲”，如今照进现实了。话不多说，请看VCR：原来，这是上海AI Lab最新推出的人形机器人“驾驶舱”——HOMIE（Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit）。一副机械臂外骨骼、一双动作感应手套，以及一块三轴脚踏板，人们就能对双足人形机器人全身进行精准遥操作了。

黄仁勋：感谢DeepSeek！英伟达财报破纪录，Blackwell开卖血赚800亿老黄笑疯

就在刚刚，英伟达公布财报。那一刻，全世界都在观望。出人意料的是，英伟达2025财年第四季度，情况一片大好，并未受DeepSeek影响！

AI工厂作为新兴的数据中心概念，正引领着AI处理技术的革新，然而，其真正潜力如何?成本与挑战又有哪些?本文将深入探讨AI工厂的现状与未来。你可能听说过“AI工厂”这个词，但它到底意味着什么?到目前为止，这个概念更多地被炒作而非明确定义，主要是由英伟达在推动。该公司的愿景是数据中心里装满高端AI加速器，但这个愿景是现实可行的，还是只是战略营销手段?简而言之，AI工厂是专为AI处理而设计的专业化数据中心，而非用于托管数据库、文件存储、业务应用或网络服务等传统工作负载。

用「完形填空」的思维生成蛋白-分子复合物，西湖大学等发布CBGBench助力药物设计

编辑 | ScienceAI本文作者为西湖大学 Haitao Lin，Yufei Huang, 深势科技 Guojiang Zhao，Zhifeng Gao，及华盛顿大学 Odin Zhang 等；通讯作者为 Stan Z. 被 ICLR2025 接受为 spotlight paper。原文链接：：（Structure-Based Drug Design, SBDD）旨在生成能够与目标蛋白结合的潜在药物分子，并在生成式 AI 技术的推动下得到了极大加速。

AI改变世界的6种方式：微软AI助力农业、生态、医疗、气候、教育等领域

编辑 | 白菜叶人工智能正在以惊人的方式改变着世界，从改善医疗保健和教育到让残障人士的生活更轻松。它正在改变人们的生活和工作方式，其分析大量复杂数据的能力使科学家能够研究哥伦比亚的亚马逊雨林，帮助印度的甘蔗种植户优化作物产量等等。以下是微软 AI 为世界带来积极变化的六种方式。

不要自回归！扩散模型作者创业，首个商业级扩散LLM来了，编程秒出结果

当前的 AI 领域，可以说 Transformer 与扩散模型是最热门的模型架构。也因此，有不少研究团队都在尝试将这两种架构融合到一起，以两者之长探索新一代的模型范式，比如我们之前报道过的 LLaDA。不过，之前这些成果都还只是研究探索，并未真正实现大规模应用。

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

动辄百亿、千亿参数的大模型正在一路狂奔，但「小而美」的模型也在闪闪发光。 2024 年底，微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型（SLM）。仅用了 40% 合成数据，140 亿参数的 Phi-4 就在数学性能上击败了 GPT-4o。

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

按时整活！ DeepSeek开源周第四天，直接痛快「1日3连发」，且全都围绕一个主题：优化并行策略。 DualPipe：一种创新的双向流水线并行算法，能够完全重叠前向和后向计算-通信阶段，并减少“流水线气泡”。

摆脱编码器依赖！Encoder-free 3D多模态大模型，性能超越13B现有SOTA | 上海AI Lab港中文等团队新作

无编码器多模态大模型被拓展到3D领域——3D编码器的功能被融入LLM本身，无编码器3D LMM适应不同的点云分辨率，摆脱预训练编码器的依赖。来自上海AI Lab、西北工业大学、香港中文大学、清华大学等提出ENEL，在预训练阶段探索了如何使用自监督损失将3D编码器的功能整合到LLM本身，在指令调优阶段提出了一种层次几何聚合策略，基于PointLLM首次全面研究了无编码器架构在3D多模态大模型中的潜力。在Objaverse基准测试中，ENEL表现突出，性能上超越目前SOTA ShapeLLM-13B。

超越Sora！阿里正式完全开源最新、最强大的视频生成模型 Wan2.1

阿里巴巴通义实验室正式开源了他们最新、最强大的视频生成模型 Wan2.1 系列！ Wan2.1 亮点速览✨ 复杂运动: 视频动作更流畅自然，复杂场景也能轻松驾驭🧲 物理模拟: 物体交互更真实，视频更具沉浸感🎬 电影质感: 视觉效果更上一层楼，细节更丰富，更具艺术性✏️ 可控编辑: 编辑能力更强大，创作空间更广阔✍️ 视觉文字: 中英文动态文字生成，应用场景更丰富🎶 音效音乐: 视听体验一体化，视频极具感染力Wan2.1 系列模型家族，为不同需求的用户提供了多样化的选择：Wan2.1-I2V-14B: 图像到视频 (I2V) 领域的天花板！ 140亿参数，720P高清画质，I2V 性能 SOTA！

榨干每一分算力：Distillation Scaling Laws带你走进高效模型新时代

理论