模型

Anthropic预测26年AI智力堪比诺奖得主！美国AI行动计划发布在即，五角大楼紧急布局

截止到2026-2027年，AI智力水平将达到诺奖级得主。 Anthropic最新长文，再次宣告，人类离超级智能体近在咫尺。报告地址：，CEO Dario Amodei在「Machines of Loving Grace」一文中，曾大胆预测——2026年底-2027年初，人类将见证强大AI系统诞生。

3/10/2025 7:30:00 AM

新智元

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚，7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事？图片新方法LADDER，通过递归问题分解实现AI模型的自我改进，同时不需要人工标注数据。使Deepseek-R1蒸馏的Qwen2.5 7B模型在麻省理工学院积分大赛（MIT Integration Bee）上达到90分超越o1。

3/10/2025 1:00:00 AM

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

研究团队构成：香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员：香港科技大学的研究助理教授曹嘉伦，主要研究领域包括 AI&SE、人工智能测试、形式化验证等；中国科学院软件研究所副研究员陆垚杰，主要研究领域包括大语言模型及其应用。随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。

3/8/2025 3:46:00 PM

机器之心

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。」这是一篇标题为「The Model is the Product（模型即产品）」的文章的主要观点。文章指出，当前很多企业都以集成商的形式在提供 AI 服务，也就是调用 OpenAI、Anthropic 等大公司模型的 API。

3/8/2025 3:31:00 PM

机器之心

Nature子刊 | 光镜电镜通用，Meta「分割一切」模型用到显微镜图像上了

编辑丨coisini识别显微镜图像中的对象，例如光学显微镜（LM）下的细胞和细胞核是生物学图像分析中的关键任务之一。由于显微镜成像方式的多样性和不同维度（二维 / 三维，时间维度）的存在，这些识别任务具有挑战性，目前需要采用不同的方法来解决。基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割，电子显微镜（EM）下的细胞、神经元和细胞器分割。

3/7/2025 1:14:00 PM

ScienceAI

在人工智能领域，DeepSeek-R1的推出引发了广泛关注，这一创新代表了 AI 产业的颠覆性进展。其多头潜在注意力网络（Multi-head Latent Attention，MLA）架构，借助低秩压缩技术显著降低了训练与推理的成本，甚至仅为同等性能大模型的十分之一。这一成果由复旦大学 NLP 实验室的博士后纪焘及其团队共同完成，目标是让任意预训练的大语言模型能够快速迁移到 MLA 架构，而无需重新从头开始训练。

3/7/2025 10:52:00 AM

AI在线

沉寂很久的Mistral AI推出号称世界最强OCR

欧洲AI明星公司Mistral AI 今日发布 Mistral OCR，一款号称“世界最佳文档理解 API”的全新产品。 Mistral OCR 是一款光学字符识别（OCR）API，但它远不止于简单的文字识别。与其他模型不同，Mistral OCR 能够全面理解文档的每一个元素，包括媒体、文本、表格、公式等，并展现出前所未有的准确性和认知能力。

3/7/2025 10:23:03 AM

AI寒武纪

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

I 圈又炸了锅！另一个来自中国本土"DeepSeek"时刻今天，Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版！这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版，而是一个真正意义上的自主智能体，它最大的亮点在于：打通了从想法到执行的完整链路！

3/7/2025 10:12:16 AM

AI寒武纪

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

2025年3月6日，一款名为 **Light-R1-32B** 的全新语言模型正式亮相。这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器，经过特别训练，以其卓越的数学解题能力、低廉的训练成本以及可复现性，成为人工智能领域的一大亮点。开发团队xAI表示，Light-R1-32B不仅在性能上超越同类模型，还为学术研究和实际应用提供了极具价值的参考。

3/7/2025 10:00:29 AM

AI在线

诸葛亮 + 水浒传 - 三国演义 = ？一文搞懂什么是向量嵌入

一起来开个脑洞，如果诸葛亮穿越到《水浒传》的世界，他会成为谁？武松、宋江、还是吴用？这看似是一道文学题，但我们可以用数学方法来求解：诸葛亮水浒传 - 三国演义 = ？

3/7/2025 9:00:00 AM

小喵学AI

智源BGE-VL拍照提问即可精准搜，1/70数据击穿多模态检索天花板！

BGE系列模型自发布以来广受社区好评。近日，智源研究院联合多所高校开发了多模态向量模型BGE-VL，进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。

3/7/2025 8:40:00 AM

新智元

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

凌晨，阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。它仅用320亿参数，便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1（370亿被激活）相媲美。甚至，QwQ-32B在多项基准测试中全面超越o1-mini。

3/7/2025 8:30:00 AM

新智元

从自我进化视角出发，全面解析LLM的推理能力技术演进路径

论文标题：A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接：：. 引言在人工智能领域，大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布，这一领域的研究热度持续升温，引发了广泛的学术讨论和实践探索。

3/6/2025 9:08:00 PM

机器之心

Portkey AI Gateway：轻松整合多种大语言模型的开源AI解决方案

随着开源 AI 框架的快速发展，开发者们在部署 AI 模型时获得了前所未有的灵活性。 Portkey AI Gateway 作为一款开源项目，旨在简化 AI 模型的编排，提供统一的 API 接口，助力开发者轻松整合多种 AI 模型。除了支持大型语言模型（LLMs），Portkey 还涵盖了视觉、音频(文本转语音和语音转文本)、图像生成等多模态生成 AI 模型。

3/6/2025 6:00:00 PM

AI在线

腾讯混元发布图生视频模型HunyuanVideo-I2V，并上线对口型等玩法

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展，旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术，能够将静态图像转换为生动的视频内容，为创作者提供了更多的可能性。

3/6/2025 4:34:00 PM

AI在线

Cohere发布全新多模态AI模型Aya Vision，提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称，该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务，包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。

3/6/2025 2:54:00 PM

AI在线

多模态检索新突破！智源开源多模态向量模型BGE-VL

2025年3月6日，北京智源人工智能研究院宣布开源多模态向量模型BGE-VL，这一成果标志着多模态检索领域的新突破。 BGE-VL模型在图文检索、组合图像检索等多模态检索任务中取得了最佳效果，显著提升了多模态检索的性能。 BGE-VL的开发基于大规模合成数据集MegaPairs，该数据集通过结合多模态表征模型、多模态大模型和大语言模型，从海量图文语料库中高效挖掘多模态三元组数据。

3/6/2025 2:46:00 PM

AI在线

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

什么样的AI，值得你花20000刀一个月？ OpenAI告诉你：用我们的博士级AI智能体吧，它保管值！今天这个消息，让所有人瞠目结舌：OpenAI的高管们计划发布三类智能体产品，价格分几档，最贵的一档月费高达2万美金。

3/6/2025 11:31:10 AM

新智元

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习模态 xAI 大语言模型字节跳动 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊训练特斯拉 AGI 2024

模型

Anthropic预测26年AI智力堪比诺奖得主！美国AI行动计划发布在即，五角大楼紧急布局

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

Nature子刊 | 光镜电镜通用，Meta「分割一切」模型用到显微镜图像上了

DeepSeek的MLA架构：大模型迁移的新突破

沉寂很久的Mistral AI推出号称世界最强OCR

另一个来自中国本土"DeepSeek"时刻？全球首个通用人工智能代理发布

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

诸葛亮 + 水浒传 - 三国演义 = ？一文搞懂什么是向量嵌入

智源BGE-VL拍照提问即可精准搜，1/70数据击穿多模态检索天花板！

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

从自我进化视角出发，全面解析LLM的推理能力技术演进路径

Portkey AI Gateway：轻松整合多种大语言模型的开源AI解决方案

腾讯混元发布图生视频模型HunyuanVideo-I2V，并上线对口型等玩法

​Cohere发布全新多模态AI模型Aya Vision，提供32B和8B两个版本

多模态检索新突破！智源开源多模态向量模型BGE-VL

离谱！OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

Cohere发布全新多模态AI模型Aya Vision，提供32B和8B两个版本