理论

28年AGI撞上数据墙，以后全靠测试时计算？CMU详解优化原理

2025年主导AI的将是第3代scaling law：测试时计算。正如Michael Dell转述所言：第一代scaling：预训练像读大学第二代scaling：微调像读博士第三代scaling：测试时计算就像深度思考和推理近日，计算机强校CMU机器学习系，发表博客文章解释LLM测试时计算优化问题，特别是涉及到的元强化学习（meta-RL）问题。文章亮点如下：监督学习只是在训练模型「答案是什么」，只要学习「如何解答」，模型泛化性会更好。

1/27/2025 12:34:02 PM

新智元

DeepSeek R1，如此火爆！

编辑 | 言征、伊风相信连DeepSeek的创始人梁文锋自己都没有想到，春节前的一次发布，让全球AI圈都陷入了“冰与火”之中，一方面大洋两岸都在惊叹：一家出自浙江的非“六小龙”公司能欧这么短时间就能用开源的方式，推出性能堪比甚至赶超OpenAI o1的模型，成本却更是出奇的低。一时间，全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。抱抱脸、伯克利、港科大很快就用实力证明了：DeepSeek R1 是名副其实的国产推理模型的巨大胜利！

1/27/2025 12:30:07 PM

言征

DeepSeek在美超越ChatGPT！问鼎苹果免费App第一

DeepSeek的热，还在持续ing。就在刚刚过去的周末，DeepSeek反超ChatGPT，一举登顶美区苹果应用商店免费App排行第一！其热度之高，有网友甚至这样描述：我甚至都不喜欢AI助手应用，但我已经下载了DeepSeek。

1/27/2025 12:28:55 PM

量子位

人工智能工具帮助科学家预测病毒进化

新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。疫情的毁灭性影响是一个持久的提醒。虽然我们摆脱了新冠肺炎，其他病毒或新突变仍可能构成威胁。

1/27/2025 12:28:07 PM

AI情报室

OpenAI推出Operator帮助用户自动浏览网站

OpenAI发布了一个新的用于预览的AI代理Operator，该代理可以控制计算机浏览器并代表你执行操作。该工具可以通过键入、单击和滚动与网页进行交互。 Operator是OpenAI的首批AI代理之一。

1/27/2025 12:21:51 PM

AI情报室

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。一觉醒来，DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用，直接登顶 AppStore。不少网友都认为这是他们当之无愧。

1/27/2025 12:04:37 PM

机器之心

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

大型语言模型（LLMs）在处理复杂推理任务时面临挑战，这突显了其在模拟人类认知中的不足。尽管 LLMs 擅长生成连贯文本和解决简单问题，但在需要逻辑推理、迭代方法和结果验证的复杂任务（如高级数学问题和抽象问题解决）中，其能力有所欠缺。这种局限性源于 LLMs 的信息处理方式。

1/27/2025 12:03:11 PM

Kaushik Rajan

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

1/27/2025 9:51:24 AM

AIGC开放社区

在2025年初，浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义！感觉在RL中的定义，world model是针对一个具体子任务的模型，最近上述公司提到的World Model的尺度似乎更大、更加通用，更多从：Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。当然这个World似乎想要包容一切，于是也并不清晰到底是什么样的表征：是否是video sequence?

1/27/2025 9:37:33 AM

原野寻踪

单张照片生成3D头部模型！Adobe提出FaceLift，从单一人脸图像重建360度头部模型

本文经AIGC Studio公众号授权转载，转载请联系出处。 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。 FaceLift基于两阶段的流程实现:基于扩散的多视图生成模型从单张人脸图像生成一致的侧面和背面视图;生成的视图被输入到GS-LRM重建器中,产出详细的3D高斯表示。

1/27/2025 9:32:23 AM

量子位

鄂维南李航领衔造高级论文搜索Agent，召回率和精准性超谷歌学术等，磕盐党狂喜

中科院院士鄂维南、字节AI实验室总监李航领衔，推出高级论文搜索Agent。名为PaSa，两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务，模仿人类复杂学术搜索行为。现在就有Demo可玩。

1/27/2025 9:00:00 AM

量子位

用Ray观测和监控大语言模型工作负载

译者 | 布加迪审校 | 重楼前言GPT-4、PHI2、BERT和T5等大语言模型（LLM）的出现已彻底改变了自然语言处理，这些模型支持高端应用程序，包括聊天机器人、推荐系统和分析。然而，LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。在这种情况下，在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。

1/27/2025 8:23:41 AM

布加迪

十大机器蜜蜂：机器蜜蜂能拯救地球上所有的植物吗？

译者 | 张哲刚审校 | 重楼作为一个几乎每天都要吃蜂蜜吐司的人，在过去的几年里，我一直非常关注全球蜜蜂种群持续减少这个话题。蜜蜂不仅仅是蜂蜜生产者，它们还是大自然中伟大的传粉者。尽管，就传粉者而言，它们并不是唯一，但是，据我所知，它们是唯一能够生产蜂蜜的传粉者。

1/27/2025 8:00:00 AM

张哲刚

MetaDiff：用扩散模型重塑元学习，攻克小样本学习瓶颈！

一眼概览MetaDiff 提出了一种基于条件扩散模型的创新元学习方法，通过将梯度下降优化建模为去噪过程，有效提升了小样本学习（FSL）的性能，显著减少了内循环优化中的内存负担和梯度消失风险。核心问题小样本学习的主要挑战在于：如何在训练数据有限的情况下快速适应新任务，而不引入过拟合或内存瓶颈。传统基于梯度的元学习方法需要计算内循环路径上的二阶导数，导致内存消耗高和梯度消失问题，从而影响性能。

1/27/2025 12:57:43 AM

萍哥学AI

2025年，更多AI，更多软件开发者面临的问题

组织准备好应对AI生成代码可能带来的繁琐工作、漏洞和开发者倦怠了吗？译自More AI, More Problems for Software Developers in 2025，作者 Jennifer Riggins。生成式AI创造了比以往任何时候都更多的代码。

1/27/2025 12:23:15 AM

岱军

从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用

一、引言在信息技术飞速发展的今天，运维工作已经从最初的人工操作，逐步演变为自动化、AIOps（人工智能运维）和ChatOps（通过聊天的方式去运维）。这些变革不仅提升了运维效率，还显著保障了系统的稳定性。特别是借助大模型，运维同学能够更加高效地完成工作，并应对复杂的运维挑战。

1/26/2025 3:35:01 PM

佟铁

MV-DUSt3R+: 只需2秒！Meta Reality Labs开源最新三维基座模型，多视图大场景重建

本文一作为唐正纲，目前为博士生，就读于伊利诺伊大学厄巴纳 - 香槟分校，本科毕业于北京大学。通讯作者是严志程，Meta Reality Labs 高级科研研究员 (Senior Staff Research Scientist)，主要研究方向包括三维基础模型，终端人工智能 (On-device AI) 和混合现实。近期，Fei-Fei Li 教授的 World Labs 和 Google 的 Genie 2 展示了 AI 从单图生成 3D 世界的能力。

1/26/2025 2:13:28 PM

机器之心

字节版Operator抢跑OpenAI? 直接免费开源，网友：怒省200美元！

一线大模型，正在全面进入智能体时代。 1 月 24 日凌晨 2 点，OpenAI 面向月供 200 美元的 ChatGPT Pro 用户发布了自家的 Computer Use 智能体：Operator。 OpenAI 甚至给 Operator 开设了单独的产品界面，将它视为与 ChatGPT、Sora 并列的关系，这也符合 Sam Altman、黄仁勋、扎克伯格等科技大佬对于「2025 年将是 AI 智能体之年」的趋势判断。

1/26/2025 2:07:34 PM

机器之心

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini DeepWiki：AI驱动的GitHub代码库百科全书正式亮相

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉

理论

28年AGI撞上数据墙，以后全靠测试时计算？CMU详解优化原理

DeepSeek R1，如此火爆！

DeepSeek在美超越ChatGPT！问鼎苹果免费App第一

人工智能工具帮助科学家预测病毒进化

OpenAI推出Operator帮助用户自动浏览网站

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

微软等开源AIOpsLab，可构建自主云AI Agent

在2025年初，浅浅聊一聊世界模型 World Models

单张照片生成3D头部模型！Adobe提出FaceLift，从单一人脸图像重建360度头部模型

鄂维南李航领衔造高级论文搜索Agent，召回率和精准性超谷歌学术等，磕盐党狂喜

用Ray观测和监控大语言模型工作负载

十大机器蜜蜂：机器蜜蜂能拯救地球上所有的植物吗？

MetaDiff：用扩散模型重塑元学习，攻克小样本学习瓶颈！

2025年，更多AI，更多软件开发者面临的问题

从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用

MV-DUSt3R+: 只需2秒！Meta Reality Labs开源最新三维基座模型，多视图大场景重建

字节版Operator抢跑OpenAI? 直接免费开源， 网友：怒省200美元！

字节版Operator抢跑OpenAI? 直接免费开源，网友：怒省200美元！