推理模型

字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开，4 月 17 日开放接口

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出，同时，模型采用 MoE 架构，总参数 200B，激活参数为 20B，具备显著的推理成本优势，单位推理成本相比 DeepSeek R1 降低 50%。

4/14/2025 12:44:37 PM

清源

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域，近期学术界和工业界都取得了突飞猛进的进展。在探索的过程中，一个核心的议题是：对于模型推理性能的提升来说，什么有效？什么无效？

4/13/2025 3:10:00 PM

机器之心

谷歌前科学家出品！Reka开源Reka Flash 3，能力超Gemma 3 27B

Reka AI是由十几个谷歌DeepMind前科学家们创办的公司，近日他们掷出了其首个开源模型—— Reka Flash3。这款拥有 210亿参数的推理模型，一经亮相便引发业内外的广泛关注。别看 Reka Flash3只有210亿参数，据官方介绍，这款模型是从零开始训练的通用推理模型。

3/21/2025 2:01:00 PM

AI在线

腾讯混元全新推理模型 T1 官宣：3 月 21 日发布

腾讯混元今日通过官方公众号宣布，全新的推理模型T1将于本周五（IT之家注：北京时间3月21日23时）正式发布。

3/19/2025 8:58:04 PM

清源

阿里开源推理模型QwQ-32B，性能比肩R1满血版！

Manus 发布之后，随之而来赶到战场的，是阿里。关于 Manus 的深度测评：. 一手体验首款通用Agent产品Manus昨天夜里，深夜惊雷。

3/10/2025 12:38:48 AM

数字生命卡兹克

消息称微软正开发内部 AI 推理模型，并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称，微软正在开发内部人工智能推理模型，以与OpenAI竞争，并可能向开发者出售。

3/7/2025 10:36:17 PM

清源

32B逆袭671BDeepSeek R1！阿里推理模型炸翻了：小到笔记本就能run,成本仅1/10！又是强化学习带来惊喜！

编辑 | 伊风太震撼了。阿里直接扔了一张王炸！ QwQ-32B，一个参数量如此小的小模型，居然追平了671B的DeepSeek-R1？

3/6/2025 12:43:03 PM

伊风

亚马逊研发新型推理人工智能模型，欲与OpenAI和Anthropic展开竞争

近日，有消息透露，亚马逊正在积极开发一种集成先进推理能力的人工智能模型。这一新产品计划将在今年6月份以 Nova 品牌推出，Nova 是亚马逊去年年底发布的一系列生成式人工智能模型的一部分。项目的相关人士表示，该模型旨在采用 “混合推理” 方法，能够在同一个系统中提供快速的回答以及更复杂的推理过程。

3/5/2025 9:23:00 AM

AI在线

彻底理解推理模型和通用模型

以下是通用模型和推理模型的核心总结及其区别，通过表格和关键点快速对比。一、概念1、通用模型（General-Purpose Models）定义：能够处理多种任务的模型，如文本生成、问答、翻译、摘要等，通常基于大规模预训练（如GPT系列、PaLM等）。特点：a.广泛适用性：通过海量数据预训练，学习通用语言模式和知识。

3/5/2025 12:22:00 AM

独行者木子李

消息称亚马逊正开发推理模型 Nova：又要快又要能深度思考

据一位直接参与该项目的知情人士透露，这款新产品计划最早在 6 月以“Nova”品牌发布，Nova 是亚马逊去年底推出的一系列生成式AI模型。

3/4/2025 6:17:10 PM

清源

阿里国际站推出Accio搜索引擎 AI"生意助手"提升业务效率

今日，阿里国际站宣布正式上线面向全球B2B买家的首个AI搜索引擎Accio。该引擎接入了DeepSeek等推理模型，为用户提供深度研究和商业探索功能。同时，阿里国际站还将其为中国外贸商家推出的"生意助手"AI工具全面接入推理模型。

2/28/2025 4:21:00 PM

AI在线

业界首个“混合AI推理模型”！快OpenAI一步Anthropic跳版本发布：Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈（微信号：blog51cto）就在OpenAI还在吊胃口之际，最强竞对 Anthropic 深夜开大了！ Anthropic 直接把自家的“通用推理”二合一的模型发布了，并把自家内部在用的AI编程工具也上线，直接可以终端执行任务的那种！这就带大家看看这家公司在大模型以及AI产品上的不同打法！

2/25/2025 11:59:44 AM

星璇

1/30 训练步骤复刻 DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法

现在，开源 RL 训练方法只需要用 1/30 的训练步骤就能赶上相同尺寸的 DeepSeek-R1-Zero 蒸馏 Qwen。

2/22/2025 5:48:21 PM

清源

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示：「我希望这能提供有价值的见解，并帮助你了解围绕这一主题的快速演变的文献和话题炒作。

2/9/2025 2:42:00 PM

机器之心

外国专家解读DeepSeek：预算有限，如何复制R1推理模型？纯强化学习不现实！不是任何问题都得问DeepSeek！

出品 | 51CTO技术栈（微信号：blog51cto）Sebastian Raschka是一位外国知名的AI专家。特别在大型语言模型（LLM）研究方面，有着丰富的研究经验。近日DeepSeek-R1推理模型的推出，将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能，而且所需的成本和算力都大大降低。

2/8/2025 5:47:08 PM

应对DeepSeek挑战，OpenAI增加o3-mini公开推理过程

OpenAI近日宣布展示其最新推理模型o3-mini的详细推理过程，此举被视为对竞争对手DeepSeek-R1日益增长压力的回应。这一改变标志着OpenAI在模型透明度策略上的重要转变。此前，OpenAI一直将"思维链"（Chain of Thought， CoT）视为核心竞争优势而选择隐藏。

2/8/2025 9:38:00 AM

AI在线

网易有道全面拥抱DeepSeek-R1，加速AI教育应用商业化落地

1月20日，DeepSeek震撼发布DeepSeek-R1，这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力，同时实现了API调用成本90%-95%的大幅缩减，无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道，也为包括教育在内的多个行业带来了革新动力。作为教育科技企业，网易有道坚持深入挖掘教育场景下的大模型应用价值。

2/7/2025 6:31:00 PM

朱可轩

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。

1/22/2025 11:32:00 AM

新闻助手

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练