中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

2025-01-25 05:57

据介绍，TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

感谢AI在线从中国电信人工智能研究院获悉，其“复杂推理大模型”TeleAI-t1-preview 现已正式发布，即将上线天翼 AI 开放平台。TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

官方表示，在美国数学竞赛 AIME 2024 、MATH500 两项数学基准评测中，TeleAI-t1-preview 分别以 60 和 93.8 分的成绩，大幅超越 OpenAI o1-preview、GPT-4o 等标杆模型。在研究生级别问答测试 GPQA Diamond 中，TeleAI-t1-preview 得分超过 GPT-4o，并比肩 Claude 3.5 Sonnet 的性能水准。

评测显示，将《九章算术》中的一道题目给到 TeleAI-t1-preview 后，其能够先针对文言文进行理解和简化，再转换成现代汉语，随之给出数学推导和答案。

据介绍，在此过程中，TeleAI-t1-preview 可将形象思维与抽象思维结合，对所涉及的场景进行具象化思考，辅助理解题目。不仅如此，其还能够严谨地进行古今单位换算。

TeleAI 引入了创新的训练策略，从而保障思考推理过程准确有效。

数据准备阶段：收集、构建了一个以数学为核心、多学科为补充的高质量推理数据集，确保模型能够适应不同类型的推理任务。
Judge Model（评估模型）：训练了一个 Judge Model 专门用于分析和评估模型长思考链路的正确性，为模型的反思和错误修正提供指导。
SFT（监督微调）阶段：用 MCTS（蒙特卡洛树搜索）构造高质量长推理数据，结合每个步骤的准确率和解决方案长度来选择最优的完整路径，在保证推理答案准确性的同时有效拉长思考链路以获得更细粒度的推理过程。同时使用 Judge Model 对推理过程中正确率较低的路径进行分析，引导模型对错误的推理步骤进行反思和修正，从而构造出高质量的思维链数据进行 SFT 训练。
强化学习阶段：额外构造了 Rule-based Reward Model（基于规则的奖励模型），以提供足够准确的奖励信号，通过在线强化学习算法进一步提升模型的逻辑推理能力。

国产AI之光！TeleAI星辰大模型入选央企十大国之重器评选

近日，国务院国资委新闻中心发起“十大国之重器”年度盘点，从2024年中央企业建设的众多重点项目中精心选出20项既有影响力又有创新力的大国重器，诚邀广大网友评选“年度十大国之重器”。由中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）打造的“全国产化万亿参数星辰大模型发布”光荣入选，成为国产AI的佼佼者，展现了中国电信在人工智能领域的领先地位。星辰大模型，开启国产AI新时代星辰大模型，是由中国电信自主研发打造的全国产化万亿参数大模型，是国内AI技术的重大突破。

12/25/2024 2:50:00 PM

新闻助手

中国电信天翼云盘接入 DeepSeek 模型，提升 AI 助手的智能问答能力

中国电信今日宣布，天翼云盘现已在 AI 工具中部署上线了 DeepSeek 大模型，在办公、生活、教育、健康等多场景大幅提升 AI 助手的智能问答能力。

2/10/2025 10:02:34 PM

浩渺

中国电信已在上海建成单集群的万卡智算资源池，智算规模达 13EFLOPS

中国电信昨天发布了中国电信 AI 产品升级计划和中国电信 AI 品牌标识，推出首批 AI 产品，并成立中国电信“美好家”产业生态联盟。中国电信总经理邵广禄今日在 2024 世界电信和信息社会日大会上介绍称，中国电信重点规划“2 3 7 N M”的智算布局，智算规模达到 13EFLOPS（IT之家注：每秒一百京，即 1018 次浮点运算）。目前，中国电信已在上海已建成单集群的万卡智算资源池；在智算云能力方面已初步具备云骁、慧聚和息壤的三大能力平台，实现了智算算力的统一纳管、一站提供和异构调度的能力，智算云能力

5/17/2024 6:24:21 PM

问舟

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

相关资讯

国产AI之光！TeleAI星辰大模型入选央企十大国之重器评选

中国电信天翼云盘接入 DeepSeek 模型，提升 AI 助手的智能问答能力

中国电信已在上海建成单集群的万卡智算资源池，智算规模达 13EFLOPS