腾讯“混元-T1”推理模型在基准测试中与 OpenAI 的 o1 能力相匹配

2025-03-25 10:08

腾讯近日宣布推出其最新的大型语言模型——混元-T1，并表示该模型在推理能力上可与OpenAI的最佳推理系统相匹敌。据腾讯介绍，混元-T1在开发过程中高度依赖强化学习，高达96.7%的训练后算力都用于提升模型的逻辑推理能力以及与人类偏好的一致性。在多项基准测试中，混元-T1展现出强大的性能。

腾讯近日宣布推出其最新的大型语言模型——混元-T1，并表示该模型在推理能力上可与OpenAI的最佳推理系统相匹敌。

据腾讯介绍，混元-T1在开发过程中高度依赖强化学习，高达96.7%的训练后算力都用于提升模型的逻辑推理能力以及与人类偏好的一致性。

在多项基准测试中，混元-T1展现出强大的性能。在测试14个学科知识的MMLU-PRO评估中，该模型取得了87.2分，仅略低于OpenAI的o1模型。在科学推理方面，浑元-T1在GPQA-diamond测试中获得了69.3分。

尤其值得一提的是，腾讯强调混元-T1在数学方面的卓越表现。其在MATH-500基准测试中获得了高达96.2分的成绩，仅次于Deepseek-R1。此外，该模型在代码生成（LiveCodeBench:64.9分）和高难度推理(ArenaHard:91.9分)等方面也表现出色。腾讯还指出，混元-T1在多项中文任务上的准确率超过90%。

在模型训练方面，腾讯采用了课程学习的方法，逐步增加任务难度。此外，该公司还创新性地开发了自我奖励系统，利用模型的早期版本评估新版本的输出，从而驱动模型性能的持续提升。

混元-T1采用了Transformer Mamba混合架构，腾讯声称在相同条件下，该架构处理长文本的速度是传统模型的两倍。目前，Hunyuan-T1已通过腾讯云对外开放，并且在Hugging Face上提供了演示。

此次发布是继百度和阿里巴巴相继推出其声称达到o1水平的自研模型后，中国科技巨头在AI领域展开竞争的又一重要举措。值得注意的是，阿里巴巴、百度和Deepseek都在积极推行开源战略。人工智能投资者、前谷歌中国区总裁李开复此前曾公开表示，这些中国AI模型的发展对OpenAI构成了潜在的生存威胁。

腾讯混元发布图生视频模型HunyuanVideo-I2V，并上线对口型等玩法

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展，旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术，能够将静态图像转换为生动的视频内容，为创作者提供了更多的可能性。

3/6/2025 4:34:00 PM

AI在线

腾讯混元推出 5 个开源3D模型： 30 秒生成，兼容多平台

腾讯混元宣布推出5个全新3D生成模型，并全部开源。这些基于Hunyuan3D-2.0打造的模型具有更快的生成速度、更丰富的细节和更逼真的材质表达。同时，腾讯自研的3D AI创作引擎也进行了升级，现已向C端用户全面开放。

3/18/2025 2:06:00 PM

AI在线

腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型

腾讯混元文生图大模型（混元 DiT）今日宣布开源小显存版本，仅需 6G 显存即可运行，对使用个人电脑本地部署的开发者比较友好。此外，腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语，针对文生图场景进行专门优化，可帮助开发者快速制作文生图数据集。腾讯混元 DiT 模型升级腾讯混元 DiT 模型宣布了三大更新：推出小显存版本与 Kohya 训练界面，并升级至 1.2 版本，进一步降低使用门槛的同时提升图片质量。基于 DiT 架构的文生图模型生成图片质感更佳，但对显存的要求却非常高

7/4/2024 6:52:09 PM

汪淼

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

腾讯“混元-T1”推理模型在基准测试中与 OpenAI 的 o1 能力相匹配

相关资讯

腾讯混元发布图生视频模型HunyuanVideo-I2V，并上线对口型等玩法

腾讯混元推出 5 个开源3D模型： 30 秒生成，兼容多平台

腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型