腾讯混元自研深度思考模型「T1」正式发布

近日,腾讯正式推出了其自研的深度思考模型——混元T1正式版。 混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、科学和代码等理科难题进行了专项优化,从而实现了推理能力的显著提升。 在常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的优异成绩,仅次于顶尖模型o1。

近日,腾讯正式推出了其自研的深度思考模型——混元T1正式版。

混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、科学和代码等理科难题进行了专项优化,从而实现了推理能力的显著提升。在常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的优异成绩,仅次于顶尖模型o1。同时,在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1也展现出了业界领先推理模型的水平。

腾讯最强!混元自研深度思考模型T1 正式发布:吐字快、能秒回

除了基础推理能力外,混元T1正式版还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。这得益于其沿用了混元Turbo S的创新架构,并采用了Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。

此外,基于出色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗。在相近的激活参数量下,混元T1实现了解码速度提升2倍。

目前,腾讯混元T1已经开放体验,并上线了API服务。用户可以根据需求,以每百万tokens1元的输入价格和每百万tokens4元的输出价格,享受这一强大推理模型带来的便捷与高效。

相关资讯

腾讯元宝重大升级:混元与DeepSeek模型携手开启深度思考新功能

近日,腾讯推出了其 AI 助手 “腾讯元宝” 的重要更新,引入了两大先进模型 —— 混元 T1和 DeepSeek-R1,它们均具备深度思考能力。 这一升级让用户能够更好地应对复杂问题,提高工作与学习的效率。 用户只需下载并打开腾讯元宝,即可免费体验这些新功能。

腾讯深度思考模型「混元T1」面向所有用户开放

腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放,用户可以通过腾讯元宝平台体验并测试该模型。 此前,混元T1开启灰度测试后,受到了用户的广泛关注和积极反馈。 为了满足用户需求,腾讯紧急部署,现已实现混元T1的全面开放,所有用户均可无限量使用。

腾讯元宝重大升级:混元+DeepSeek双模型支持深度思考,免费开放

腾讯AI助手"腾讯元宝"近日发布重要更新,其底层模型DeepSeek和腾讯混元均已具备"深度思考"功能,用户可通过元宝App免费体验这一新特性。 此次更新的核心是深度思考能力的引入。 与传统模型相比,支持深度思考的模型能够从多个维度分析问题,展现出更接近人类的认知过程,有助于用户更好地处理复杂工作和学习任务。