工程 - AI在线

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/25/2025 11:29:00 AM

机器之心

稀疏注意力再添一员，华为诺亚推出高效选择注意力架构ESA

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/24/2025 5:05:00 PM

机器之心

模型安全武装，复旦新研究实现SOTA扩散模型风险概念擦除效果，入选AAAI 2025

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/24/2025 5:01:00 PM

机器之心

扩散模型新突破！无需微调，就能高效稳定移除目标物体

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/24/2025 1:09:00 PM

机器之心

Bengio参与，扩散模型+蒙特卡洛树搜索实现System 2规划

把扩散模型的生成能力与 MCTS 的自适应搜索能力相结合，会是什么结果？扩散模型（Diffusion Model）通过利用大规模离线数据对轨迹分布进行建模，能够生成复杂的轨迹。与传统的自回归规划方法不同，基于扩散的规划器通过一系列去噪步骤可以整体生成完整轨迹，无需依赖前向动力学模型，有效解决了前向模型的关键局限性，特别适用于具有长周期或稀疏奖励的规划任务。

2/23/2025 5:28:00 PM

机器之心

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/22/2025 1:56:00 PM

机器之心

预测所有物种DNA、RNA、蛋白质的形式和功能，Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2

编辑 | 萝卜皮所有生命都用 DNA 编码信息。虽然测序、合成和编辑基因组代码的工具已经改变了生物学研究，但智能地编写新的生物系统还需要深入了解基因组编码的巨大复杂性。科学家们今天发布了他们所称的有史以来最大的生物学人工智能（AI）模型——Evo-2。

2/20/2025 2:57:00 PM

ScienceAI

大模型强化学习新发现：删减84%数据反提升效果

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/19/2025 6:59:00 PM

机器之心

撞车DeepSeek NSA，Kimi杨植麟署名的新注意力架构MoBA发布，代码也公开

昨天下午，DeepSeek 发布了一篇新论文，提出了一种改进版的注意力机制 NSA；加上还有创始人兼 CEO 梁文锋亲自参与，一时之间吸引眼球无数，参阅报道《刚刚！ DeepSeek 梁文锋亲自挂名，公开新注意力架构 NSA》。但其实就在同一天，月之暗面也发布了一篇主题类似的论文，并且同样巧合的是，月之暗面创始人兼 CEO 杨植麟也是该论文的署名作者之一。

2/19/2025 3:02:25 PM

机器之心

清华团队构建大型社会模拟器AgentSociety，推动智能社会治理与研究范式变革

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/19/2025 11:48:00 AM

机器之心

ICLR 2025 Spotlight | 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/19/2025 11:37:00 AM

机器之心

刚刚！DeepSeek梁文锋亲自挂名，公开新注意力架构NSA

DeepSeek 新论文来了！相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。据介绍，DeepSeek 的这篇新论文提出了一种新的注意力机制 ——NSA。

2/18/2025 5:30:00 PM

机器之心

这届出题太难了！新基准让多模态模型集体自闭，GPT-4o都是零分

眼下最顶尖的一批 LMM 是哪些？你可能想到了无所不能的 GPT-4o、Gemini 2 Flash 等等……但这些大模型，遇到一个名为「ZeroBench」的视觉基准之后，纷纷败下阵来。 20 多个知名模型，首次作答成绩如下，全部是零分：震惊之后，我们仔细研究了这个 ZeroBench 基准里的问题。

2/18/2025 12:34:00 PM

机器之心

200多行代码，超低成本复现DeepSeek R1「Aha Moment」！复旦大学开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/18/2025 10:24:00 AM

机器之心

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。又又又一个超高难度的推理基准测试向 AI 发出了挑战！大语言模型的进展伴随着评估基准的不断进步，各种难度、覆盖不同学科的评估基准被用来测试这些模型的各项能力。

2/17/2025 1:28:00 PM

机器之心

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/17/2025 10:19:00 AM

机器之心

真假难辨！阿里升级AI人像视频生成，表情动作直逼专业水准

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/16/2025 8:34:00 PM

机器之心

炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多任务过程生成

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/15/2025 7:54:00 PM

机器之心