腾讯混元自研深度思考模型 T1 发布：吐字快、能秒回，擅长超长文处理

2025-03-21 11:32

腾讯混元今日发布自研深度思考模型T1，该模型不仅吐字快、能秒回，还擅长超长文处理，展现出强大的推理能力。在多项公开基准测试中，T1成绩领先业界，特别是在长文推理领域，有效解决了上下文丢失和长距离信息依赖问题。#腾讯混元# #AI模型#

AI在线从腾讯混元微信公众号获悉，今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。

据官方介绍，「T1」吐字快、能秒回，还擅长超长文处理，是腾讯自研的强推理模型。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见 benchmark 上，如大语言模型评估增强数据集 MMLU-PRO 中，混元 T1 取得 87.2 分，仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元 T1 的成绩也达到业界领先推理模型的水平。

「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

注：表格中，其它模型的评测指标来自官方评测结果，官方评测结果中没有的部分来自混元内部评测平台结果

官方称，混元 T1 正式版沿用了混元 Turbo S 的创新架构，采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度，减少了 KV-Cache 的内存占用，从而显著降低了训练和推理成本。

官方还称，混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力，混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合 Mamba 架构针对长序列处理进行了专项优化，通过高效的计算方式，在确保长文本信息捕捉能力的同时大幅降低资源消耗，在相近的激活参数量下，实现了解码速度提升 2 倍。

腾讯混元 T1 目前已经上线：https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面，混元 T1 已在腾讯云官网上线，输入价格为每百万 tokens 1 元，输出价格为每百万 tokens 4 元。

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

AI好好用报道编辑：杨文这波「左右互搏」有看头了。腾讯向来以「慢」著称。无论是游戏、搜索还是音乐、短视频，腾讯都比其他家慢了半拍。

2/19/2025 10:27:00 AM

AI好好用

腾讯发布混元 - T1 正式版，推理能力大幅提升

近日，腾讯发布了混元大模型系列的正式版 —— 混元 - T1。这款新模型基于混元中等规模底座，经过大规模后训练，显著增强了推理能力，特别是在深度思考和复杂问题解决方面表现出色。自从今年2月混元 T1-Preview 上线以来，用户们便体验到了更快、更深刻的思考过程，而此次正式版的推出，则标志着该系列产品的进一步升级。

3/24/2025 9:54:00 AM

AI在线