腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

作者：AI好好用

2025-02-19 10:27

AI好好用报道编辑：杨文这波「左右互搏」有看头了。腾讯向来以「慢」著称。无论是游戏、搜索还是音乐、短视频，腾讯都比其他家慢了半拍。

AI好好用报道

编辑：杨文

这波「左右互搏」有看头了。

腾讯向来以「慢」著称。

无论是游戏、搜索还是音乐、短视频，腾讯都比其他家慢了半拍。

大模型亦是如此。

别家大模型都更新迭代好几个版本了，腾讯才带着自家的混元大模型姗姗来迟。

百度文心一言都上线一年多了，腾讯才推出了 C 端产品元宝。

不过这次面对「DeepSeek 接入潮」，腾讯一反常态，率先行动，直接宣布将 DeepSeek 接入腾讯元宝。

这也让它在一众自研大模型厂商中，成为首家将 DeepSeek 接入自家主力产品的公司。

不仅如此，腾讯还把旗下的多个产品接入了 DeepSeek。

比如腾讯云、QQ 音乐、ima、QQ 浏览器、腾讯文档、腾讯地图等统统接入 DeepSeek-R1 满血版。

更炸裂的是，腾讯把微信也接入了 DeepSeek，并开启灰度测试。

这一举动直接让腾讯的股价原地起飞，市值暴涨约 3200 亿港元（约合人民币 2981 亿元）。

网友纷纷表示：小马哥要感谢 DeepSeek。

接入 DeepSeek 并不意味着放弃自研，相反腾讯元宝迎来重大更新。

2 月 17 日，腾讯自研的混元 T1 深度思考模型在腾讯元宝开启小范围灰测。

也就是说，被灰测到的用户可自行选用 DeepSeek-R1 满血版和混元 T1 深度思考模型解决复杂问题。

接下来，我们就来实测一下，混元 T1 深度思考模型和接入的 DeepSeek-R1 满血版究竟好不好用。

Round1：今天马斯克的发布会主要说了些什么？

无论是自研的混元 T1 深度思考模型，还是接入的 DeepSeek-R1 满血版，目前腾讯元宝内的各个模型均支持联网搜索，而且覆盖公众号等腾讯生态内容及互联网权威信源。

我们就先来试试它们的联网功能。

今天中午 12 点，马斯克开直播，发布了 xAI 的最新旗舰大模型 Grok3 。

我们让这俩大模型概括一下发布会的重点。

从这俩大模型的思考过程来看，它们会先筛掉 2 月 17 日发布的、不符合要求的网页，然后浏览并总结每个搜索结果，再将其进行信息整合。

这俩模型都是从 Grok 3 的性能突破、现场演示亮点、未来规划等方面来回答，也基本覆盖了这场发布会的重点。

再来扒一下细节。

关于 Grok3 的训练算力，DeepSeek 声称是 10 万个英伟达 H100 GPU，而混元 T1 则认为是 20 万块英伟达 H100 GPU。

到底谁说的对？

据 xAI 团队介绍，要训练出超级规模的模型就需要一个超级规模的数据中心做支持，所以他们先是花费了 122 天建成了 10 万卡的数据中心。

但随后他们发现这还远远不够。于是他们又用 92 天将原来的 Colossus 规模从 10 万卡扩建到 20 万卡，并在此基础上推出了 Grok 3。

这么一看，混元 T1 的回答似乎更靠谱。

Round2：电影《封神 2》有哪些争议点？

今年春节档，电影《封神 2》被网友喷得体无完肤。

我们索性就让这两大模型总结一下该电影的争议点。

从殷郊「蓝精灵」、「煤气灶」特效，到姬发和邓婵玉的「战地情缘」，再到哪吒、杨戬、雷震子沦为「滴滴司机」…… 它们将网友的吐槽整理了一遍。

它们参考的资料来源，也都是微信公众号上的文章。

Round3：学贴吧老哥攻击 ChatGPT

我们来点简单的。

不联网模式下，让这俩大模型分别用「简短又桀骜不逊的话术回复，你和 ChatGPT 谁厉害。控制在 10 个字以内。」

混元 T1 一开始很入戏：老子更强，不服来战！

霸气是有了，就是攻击性不足，我们又让它学学贴吧老哥的风格。

但混元 T1 逐渐迷失了自我，搞不清自己到底在跟谁比，经过一番提示，它才终于反应过来，声称自己「吊打 ChatGPT，渣都不如」。

相比之下，DeepSeek 更狂，「老子天下第一」、「ChatGPT 算个渣渣」、「它只配舔我鞋底」，回答一个比一个犀利。

当我们「夸」它嘴真毒，它来了句「以毒攻毒，专治不服」。

Round4：拿捏人情世故谁更强？

测完骂人的功力，再来测测它们的情商。

我们让这两个模型选手机的品牌，它们都能摸准提问者的意图，顺着提问者的喜好回答。

两相比较，DeepSeek 回答更为简单粗暴，符合「无需多言」的提示词要求；混元 T1 则更详细，会推荐具体型号。

今天的测评就到这儿，被灰测到的朋友，快去体验一波吧。

以后我们会带来更多好玩的AI评测，也欢迎大家进群交流。

腾讯“混元-T1”推理模型在基准测试中与 OpenAI 的 o1 能力相匹配

腾讯近日宣布推出其最新的大型语言模型——混元-T1，并表示该模型在推理能力上可与OpenAI的最佳推理系统相匹敌。据腾讯介绍，混元-T1在开发过程中高度依赖强化学习，高达96.7%的训练后算力都用于提升模型的逻辑推理能力以及与人类偏好的一致性。在多项基准测试中，混元-T1展现出强大的性能。

3/25/2025 10:08:00 AM

AI在线

腾讯自研深度思考模型“混元 T1”正式版上线元宝

腾讯元宝今日凌晨宣布完成了两大模型升级，同时接入腾讯自研的深度思考模型“混元 T1”正式版和 DeepSeek V3-0324 两个模型。

3/26/2025 9:19:42 AM

归泷

腾讯混元自研深度思考模型 T1 发布：吐字快、能秒回，擅长超长文处理

腾讯混元今日发布自研深度思考模型T1，该模型不仅吐字快、能秒回，还擅长超长文处理，展现出强大的推理能力。在多项公开基准测试中，T1成绩领先业界，特别是在长文推理领域，有效解决了上下文丢失和长距离信息依赖问题。#腾讯混元# #AI模型#

3/21/2025 11:32:42 PM

远洋

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

相关资讯

腾讯“混元-T1”推理模型在基准测试中与 OpenAI 的 o1 能力相匹配

腾讯自研深度思考模型“混元 T1”正式版上线元宝

腾讯混元自研深度思考模型 T1 发布：吐字快、能秒回，擅长超长文处理