工程 - AI在线

从想太多到想不透？DeepSeek-R1等长推理模型也存在「思考不足」问题

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/15/2025 7:51:00 PM

机器之心

苹果也在蒸馏大模型，给出了蒸馏Scaling Laws

蒸馏模型的性能可以量化估算了。众所周知，知识蒸馏技术当前正被大模型领域广泛使用，它可以在大幅压缩模型体量的同时保持一定的性能、降低模型时延、提升模型精度，与此同时还能对知识域进行集成和迁移。近日，苹果研究人员提出了一种蒸馏扩展定律（Distillation Scaling Laws），基于计算预算及其在学生和教师之间的分配，我们现在开始可以估算蒸馏模型的性能了。

2/14/2025 1:11:00 PM

机器之心

啊！DeepSeek-R1、o3-mini能解奥数题却算不了多位数乘法？

我们都知道，普通大模型的数学能力并不好，甚至可能会搞不清楚 9.8 和 9.11 哪个大。但随着 o1、o3 以及 DeepSeek-R1 等推理模型的到来，情况正在发生变化。比如 DeepSeek-R1 在竞赛数学基准 AIME 2024 上达到了 79.8% 的准确度，成就了自己头号开源推理模型的地位。

2/14/2025 10:24:00 AM

机器之心

单卡3090帮你一口气看完《黑悟空》，港大百度打造超长视频理解引擎VideoRAG

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/13/2025 3:43:00 PM

机器之心

DeepSeek R1不编程就能生成GPU内核，比熟练工程师好，惊到了英伟达

这项尝试只用到了 R1 模型和基本验证器，没有针对 R1 的工具，没有对专有的英伟达代码进行微调。其实根据 DeepSeek 介绍，R1 的编码能力不算顶尖。 DeepSeek 引爆 AI 社区后，人们都在尝试本地部署和各领域应用，在新模型基础上持续改进的方向也被不断提出。

2/13/2025 1:00:00 PM

机器之心

超越思维链？深度循环隐式推理引爆AI圈，LLM扩展有了新维度

不需要特殊训练数据，能处理语言难以形容的任务，3.5B 参数能实现 50B 的性能。这是一种全新的语言模型架构，能够通过使用循环语言模型在潜在空间中隐式推理，显著提升模型的计算效率，尤其是在需要复杂推理的任务上。近日，马里兰大学的一篇论文在 AI 研究社区中引发了关注，其提出的语言模型通过迭代循环块来工作，能在测试时展开到任意深度。

2/12/2025 2:22:00 PM

机器之心

网传DeepSeek R1更容易被越狱？这有个入选顶会的防御框架SelfDefend

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/11/2025 2:32:00 PM

机器之心

北航推出TinyLLaVA-Video，有限计算资源优于部分7B模型，代码、模型、训练数据全开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/10/2025 1:10:00 PM

机器之心

无需引导采样，清华大学提出视觉模型训练新范式

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/9/2025 2:30:00 PM

机器之心

从扭秧歌到单脚跳，HugWBC让人形机器人运动天赋觉醒了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/8/2025 10:44:00 AM

机器之心

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/7/2025 1:44:00 PM

机器之心

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/7/2025 1:38:00 PM

机器之心

ICLR 2025｜高效重建几何精准的大规模复杂三维场景，中科院提出CityGaussianV2

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/5/2025 2:22:00 PM

机器之心

ICLR 2025 | 极性感知线性注意力！哈工深张正团队提出PolaFormer视觉基础模型

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/1/2025 7:44:00 PM

机器之心

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

奥特曼能不急吗？被 DeepSeek 狂轰乱炸了一周后，终于在今天发布了新的模型 o3-mini。此次发布，o3-mini 包含 low、medium 和 high 三个版本。

2/1/2025 11:48:00 AM

机器之心

ICLR 2025｜大模型也需要好奇心，TeleAI 提出探索驱动的对齐方法，8B越级胜70B

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

1/30/2025 7:40:00 PM

机器之心

医疗具身智能发展到哪了？看这一篇综述就够了！

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

1/29/2025 6:37:00 PM

机器之心

执行推理时能对齐语言模型吗？谷歌InfAlign带来一种对齐新思路

在根据某个奖励微调生成式语言模型时，使用 KL 正则化的强化学习（KL-RL）来对齐生成式语言模型是一种常用框架。而 KL-RL 通常需要训练一个奖励模型，然后使用一个强化学习求解器。其它方法还包括直接偏好优化、奖励模型蒸馏、best-of-N 蒸馏的不同变体版本。

1/27/2025 8:27:00 PM

机器之心