腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

腾讯官方表示,区别于 Deepseek R1、混元 T1 等需要“想一下再回答”的慢思考模型,混元 Turbo S 能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低 44%。

腾讯混元新一代快思考模型 Turbo S 今日正式发布。

腾讯官方表示,区别于 Deepseek R1、混元 T1 等需要“想一下再回答”的慢思考模型,混元 Turbo S 能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低 44%

在业界通用的多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude 等一系列业模型的效果表现。

图片

图片

架构方面,混元 Turbo S 采用 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。

腾讯还称,新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面,发挥了 Mamba 高效处理长序列的能力;另一方面,也保留 Transformer 擅于捕捉复杂上下文的优势,最终构建了显存与计算效率双优的混合架构。

这也是“工业界首次”成功将 Mamba 架构无损地应用在超大型 MoE 模型上。通过模型架构上的技术创新,混元 Turbo S 部署成本大幅下降。

作为旗舰模型,混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。

基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元也推出了具备深度思考的推理模型 T1。

AI在线从腾讯公告获悉,当前,开发者和企业用户已经可以在腾讯云上通过 API 调用腾讯混元 Turbo S ,即日起一周内免费试用

定价上,Turbo S 输入价格为 0.8 元 / 百万 tokens,输出价格为 2 元 / 百万 tokens

腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。

相关资讯

腾讯混元 3D 生成大模型 2.0 开源发布,同步上线“业界首个一站式 3D 内容 AI 创作平台”

腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎,号称是“业界首个一站式 3D 内容 AI 创作平台”。

腾讯混元发布并开源图生视频模型:可生成 5 秒短视频,还能自动配上背景音效

腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及 2K 高质量视频。基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成 5 秒的短视频,还能自动配上背景音效。

QQ浏览器推出AI问答功能“元宝快答”:基于混元快思考模型Turbo S

3月7日,QQ浏览器宣布推出AI问答功能——“元宝快答”,旨在为用户提供更快速、更精炼的搜索答案体验。 该功能基于腾讯混元的“快思考”模型Turbo S,结合了搜索增强技术,能够快速检索全网实时信息,包括公众号等优质内容,并自动提炼重点,为用户提供简洁明了的回答。 用户在QQ浏览器的手机或电脑端,通过搜狗搜索或全网搜索模式提问时,元宝快答能够在瞬间给出答案,极大地提升了搜索效率。