腾讯混元新一代快思考模型 Turbo S 发布 即将在腾讯元宝中上线

2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。 与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。 这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

混元Turbo S的设计灵感来源于人类日常决策中90%~95%依赖直觉的快思考模式,与理性分析的慢思考模式相结合,为大模型提供了更智能、高效的解决问题能力。通过长短思维链的融合,该模型不仅在文科问题上保持快速体验,还显著改进了理科推理能力,整体性能大幅提升。在业界通用的多个公开Benchmark测试中,混元Turbo S展现出与DeepSeek V3、GPT4o、Claude等领先模型相当的效果。

微信截图_20250227173715.png

在架构创新方面,混元Turbo S采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,显著降低了训练和推理成本。这一混合架构突破了传统大模型在长文训练和推理成本高的难题,发挥了Mamba架构处理长序列的优势,同时保留了Transformer捕捉复杂上下文的能力,成为工业界首次成功将Mamba架构无损应用于超大型MoE模型的案例。

作为腾讯混元系列的核心基座,混元Turbo S未来将为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝全量上线,并将很快对外提供API接入服务。

目前,开发者和企业用户已可在腾讯云官网通过API调用混元Turbo S,并享受一周内免费试用的优惠。该模型的定价为输入0.8元/百万tokens,输出2元/百万tokens,相比前代混元Turbo模型大幅降价。此外,混元Turbo S也即将在腾讯元宝中逐步灰度上线,用户可在元宝内选择“Hunyuan”模型并关闭深度思考功能进行体验。

腾讯混元turbos模型API免费试用申请:https://cloud.tencent.com/apply/p/i2zophus2x8

相关资讯

腾讯发布新一代大模型“混元 Turbo”:推理效率提升 100%,成本降低 50%

感谢在今日的 2024 腾讯全球数字生态大会上,腾讯正式发布新一代大模型 —— 腾讯混元 Turbo。据腾讯官方介绍,该模型采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。对外,腾讯混元 Turbo 的价格也比混元 Pro 降低 50%,输出价格为 0.05 元 / 千 tokens,输入价格为 0.015 元 / 千 tokens。9 月 2 日,中文大模型测评基准 SuperCLUE 发布《中文大模型基准测评 2024 年 8 月报告》,AI在线查询获悉,混元新一代大语言模型预览版

腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多

随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。