通义千问

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

最近 AI 大模型领域可以说是热点话题不断，DeepSeek 的热潮还未消退，国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议

2/7/2025 2:13:55 PM

汐元

全球第一：阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单

1 月 29 日新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，号称在多个基准测试中超越 DeepSeek V3 登竞争对手。

2/5/2025 6:42:42 PM

问舟

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

据介绍，通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

1/29/2025 3:15:06 AM

问舟

阿里通义千问全新视觉理解模型 Qwen2.5-VL 开源：三尺寸版本、支持理解长视频和捕捉事件等能力

阿里通义千问官方今日发文宣布，开源全新的视觉理解模型 Qwen2.5-VL——Qwen 模型家族的旗舰视觉语言模型，推出了 3B、7B 和 72B 三个尺寸版本。

1/28/2025 7:48:15 AM

归泷（实习）

支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

通义千问本次发布了两个新的开源模型，分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M，这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。

1/27/2025 7:14:12 AM

浩渺

阿里发布 Qwen-Agent 框架，赋能开发者构建复杂 AI 智能体

阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent，基于现有 Qwen 语言模型，支持智能体执行复杂任务，并提供多种高级功能，赋能开发者构建更强大的 AI 智能体。

1/4/2025 2:04:28 PM

故渊

AI 编程能力哪家强？阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 最新推出 CodeElo 基准测试，通过和人类程序员对比的 Elo 评级系统，来评估大语言模型（LLM）的编程水平。

1/4/2025 1:32:24 PM

故渊

阿里通义千问开源视觉推理模型 QVQ-72B-Preview：像物理学家一样思考

阿里通义千问 Qwen 团队今天（12 月 25 日）发布博文，宣布基于 Qwen2-VL-72B 构建，推出 QVQ-72B-Preview 开源视觉推理模型，能够像物理学大师一样，面对复杂的物理问题，沉着冷静地通过逻辑推理找到解决方案。

12/25/2024 11:29:25 AM

故渊

吴泳铭：阿里已发布超 100 个开源模型，超 30 万家企业接入通义大模型

据其介绍，目前已有超过30万家企业接入通义大模型，利用 AI 技术重塑代码开发、药物研发、生产制造等多个行业。

11/21/2024 6:03:10 PM

清源

阿里巴巴 CEO 吴泳铭：通义千问 API 调用价格一年下降 97%

吴泳铭透露，过去一年，阿里巴巴在 AI 基础设施方面进行了高强度投入。得益于规模效应和技术进步，算力成本持续降低。其中，阿里大模型“通义千问”的 API 调用价格在一年内降幅高达 97%，百万 token 调用成本最低已降至 0.5 元。他认为，“就像足够便宜的电力带来电气化时代的大爆发，足够便宜的算力终将把我们带进智能化时代”。

11/20/2024 6:15:23 PM

远洋

阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

阿里通义千问昨日（11 月 18 日）发布博文，宣布在经过数月的优化和打磨后，针对社区中对更长上下文长度（Context Length）的要求，推出了 Qwen2.5-Turbo 开源 AI 模型。

11/19/2024 2:18:29 PM

故渊

阿里通义代码模式上线：号称即便不懂编程，也能大白话一键生成应用

通义代码模式基于 Qwen2.5-Coder 模型开发，官方表示即便用户不懂代码和编程，也可用大白话让通义 AI 自动编码，网站、数据图表和小游戏等。

11/15/2024 4:33:10 PM

沛霖（实习）

阿里通义千问开源 Qwen2.5-Coder 全系列模型，号称代码能力追平 GPT-4o

阿里通义千问此前开源了 1.5B、7B 两个尺寸，本次开源带来 0.5B、3B、14B、32B 四个尺寸，覆盖了主流的六个模型尺寸。

11/12/2024 4:04:01 PM

沛霖（实习）

先让不懂代码的来测？通义这个新产品，代码刚写完，预览就出来了

这才是未来 AI 该有的样子？奇怪了。一款 AI 代码工具刚发布，限量测试却要求「不懂代码」的人优先。

10/28/2024 1:18:00 PM

机器之心

最受欢迎开源大模型，为什么是通义？

开源与闭源之争早已非新奇的话题，但毋庸置疑的是，开源极大地促进了大模型技术发展和生态繁荣。大模型被认为是最烧钱的技术，训练一个大模型往往需要大量的数据、计算资源，导致训练成本巨大，众所周知GPT-3的训练费用据说超过 4600万美元，在大模型开源之前，大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮，那些没有AI积累的企业、大量中小公司团队，今天个人开发者，都能基于开源底座模型，用很低的成本训练、部署自己的专属模型，llama 这样的开源先锋也因此拥有一众拥趸。

9/29/2024 11:15:00 AM

张进

真·AI程序员来了，阿里云「通义灵码」全面进化，全流程开发仅用几分钟

5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下，一个几乎没有专业编程经验的初中生，在人头攒动的展台上从零开始，两分钟就做出了一个倒计时网页。他需要做的，只是输入包含几句话的提示词。数秒钟后，大模型就生成了代码，还列出了环境需求，复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目，而是人人都可以尝试的事。在大模型的帮助下，代码正在成为低门槛的设计工具。昨天，阿里云完成了「可能是历史上最大规模的模型开源发布」，开源了通义千问 Qwen2.5 系列模型，又在云栖大会的年度重磅发布中

9/20/2024 1:41:00 PM

机器之心

阿里云Qwen2.5发布！再登开源大模型王座，Qwen-Max性能逼近GPT-4o

人工智能领域再度迎来重磅消息！ 2023 年 8 月，通义首次开源后迅速引起全球开发者的关注和热议，短短一年时间内，阿里云大模型又迎来了重要升级。在 9 月 19 日的云栖大会上，CTO 周靖人宣布：通义千问发布新一代开源模型 Qwen2.5，开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B，再次登上全球开源大模型的王座；通义旗舰模型 Qwen-Max 全方位升级，性能已经逼近 GPT-4o。发布现场，图源：泽南通义千问凭借不

9/19/2024 5:31:00 PM

机器之心

Anthropic 联设 1 亿美元 AI 初创基金；OpenAI推出“小”模型GPT-4o Mini；通义千问大模型技术骨干周畅将离职创业丨AI情报局

今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一，双方合作推出了名为 Anthology Fund 的 1 亿美元人工智能初创基金，旨在投资于人工智能领域的种子前、种子和 A 轮公司。该基金将为初创企业提供从 10 万美元起步的投资，并提供 25 万美元的信用额度以使用 Anthropic 的模型。 Menlo 将利用其自家的机器学习工具来评估和排名申请，并承诺对表现出色的公司进行后续融资的支持。

7/19/2024 10:39:00 AM

我在思考中

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练