AI在线 AI在线

推理模型

OpenAI 推出全新推理模型 o3,实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线

ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低

仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM

字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。
4/14/2025 12:44:37 PM
清源

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。 在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效? 什么无效?
4/13/2025 3:10:00 PM
机器之心

谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B

Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。 这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。 别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。
3/21/2025 2:01:00 PM
AI在线

腾讯混元全新推理模型 T1 官宣:3 月 21 日发布

腾讯混元今日通过官方公众号宣布,全新的推理模型T1将于本周五(IT之家注:北京时间3月21日23时)正式发布。
3/19/2025 8:58:04 PM
清源

阿里开源推理模型QwQ-32B,性能比肩R1满血版!

Manus 发布之后,随之而来赶到战场的,是阿里。 关于 Manus 的深度测评:. 一手体验首款通用Agent产品Manus昨天夜里,深夜惊雷。
3/10/2025 12:38:48 AM
数字生命卡兹克

消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。
3/7/2025 10:36:17 PM
清源

32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!

编辑 | 伊风太震撼了。 阿里直接扔了一张王炸! QwQ-32B,一个参数量如此小的小模型,居然追平了671B的DeepSeek-R1?
3/6/2025 12:43:03 PM
伊风

亚马逊研发新型推理人工智能模型,欲与OpenAI和Anthropic展开竞争

近日,有消息透露,亚马逊正在积极开发一种集成先进推理能力的人工智能模型。 这一新产品计划将在今年6月份以 Nova 品牌推出,Nova 是亚马逊去年年底发布的一系列生成式人工智能模型的一部分。 项目的相关人士表示,该模型旨在采用 “混合推理” 方法,能够在同一个系统中提供快速的回答以及更复杂的推理过程。
3/5/2025 9:23:00 AM
AI在线

彻底理解推理模型和通用模型

以下是通用模型和推理模型的核心总结及其区别,通过表格和关键点快速对比。 一、概念1、通用模型(General-Purpose Models)定义:能够处理多种任务的模型,如文本生成、问答、翻译、摘要等,通常基于大规模预训练(如GPT系列、PaLM等)。 特点:a.广泛适用性:通过海量数据预训练,学习通用语言模式和知识。
3/5/2025 12:22:00 AM
独行者木子李

消息称亚马逊正开发推理模型 Nova:又要快又要能深度思考

据一位直接参与该项目的知情人士透露,这款新产品计划最早在 6 月以“Nova”品牌发布,Nova 是亚马逊去年底推出的一系列生成式AI模型。
3/4/2025 6:17:10 PM
清源

阿里国际站推出Accio搜索引擎 AI"生意助手"提升业务效率

今日,阿里国际站宣布正式上线面向全球B2B买家的首个AI搜索引擎Accio。 该引擎接入了DeepSeek等推理模型,为用户提供深度研究和商业探索功能。 同时,阿里国际站还将其为中国外贸商家推出的"生意助手"AI工具全面接入推理模型。
2/28/2025 4:21:00 PM
AI在线

业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇

1/30 训练步骤复刻 DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法

现在,开源 RL 训练方法只需要用 1/30 的训练步骤就能赶上相同尺寸的 DeepSeek-R1-Zero 蒸馏 Qwen。
2/22/2025 5:48:21 PM
清源

Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心

外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!

出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM

应对DeepSeek挑战,OpenAI增加o3-mini公开推理过程

OpenAI近日宣布展示其最新推理模型o3-mini的详细推理过程,此举被视为对竞争对手DeepSeek-R1日益增长压力的回应。 这一改变标志着OpenAI在模型透明度策略上的重要转变。 此前,OpenAI一直将"思维链"(Chain of Thought, CoT)视为核心竞争优势而选择隐藏。
2/8/2025 9:38:00 AM
AI在线