通义灵码上线Qwen2.5-Max推理模型

2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。 在多项基准测试中,Qwen2.5-Max表现突出。

2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。

在多项基准测试中,Qwen2.5-Max表现突出。例如,在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等测试中,Qwen2.5-Max的成绩领先于业界其他领先模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet。此外,在MMLU-Pro等评估中,Qwen2.5-Max也展现了极具竞争力的成绩。

微信截图_20250303214041.png

在基座模型的对比中,Qwen2.5-Max与DeepSeek V3、Llama-3.1-405B以及Qwen2.5-72B等模型进行了全面比较。结果显示,通义千问的基座模型在多数基准测试中都展现出显著优势。

值得注意的是,三方基准测试平台Chatbot Arena公布的最新大模型盲测榜单中,Qwen2.5-Max超越了DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,成为中国非推理类大模型的冠军。在数学和编程等单项能力上,Qwen2.5-Max排名第一,硬提示(Hard prompts)能力排名第二。Chatbot Arena官方评价称,阿里巴巴的Qwen2.5-Max在多个领域表现强劲,尤其是在编程、数学和硬提示等专业技术领域。

目前,Qwen2.5-Max已经集成到通义灵码中,用户可以通过下载通义灵码插件来体验其强大的编程能力。

相关资讯

阿里云全面推行 AI 写代码,未来 20% 代码由通义灵码编写

阿里云正在内部全面推行 AI 编程,使用通义灵码辅助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。据阿里云相关人士透露:“公司未来 20% 的代码将由通义灵码编写,但程序员仍然是研发的核心,他们将有更多时间专注于系统设计以及核心业务开发工作。”据介绍,传统开发模式下,程序员每天需要耗费大量精力编写重复性代码、调试优化、编写代码注释等基础工作,大幅挤压了核心业务代码编写的时间。在阿里云内部,通义灵码已在各个开发环节担任代码助理角色。以 API 开发测试工

阿里云推出首个 AI 程序员,具备架构师、开发 / 测试工程师等岗位技能

在今天的阿里云上海 AI 峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。据介绍,该“AI 程序员”是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与“通义灵码”有所不同。在收到用户需求后,“AI 程序员”就可实现软件开发“一条龙”:理解需求-拆分任务-编写代码-识别并解决报错-提交代码。 据IT之家此前报道,阿里云去年 11 月推出了 AI 编程工具通义灵码,兼容 

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场,个人专业版限时免费

通义灵码是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级 / 函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,支持 Java、Python、Go、C 等 200 多种编程语言。通义灵码 6 月 20 日宣布上线了微软 Visual Studio 插件市场,该工具此前已上线了 Visual Studio Code、JetBrains IDEs 等主流编程工具,全渠道下载量超 350 万。Visual Studio(VS)是微软推出的一款集