通义灵码团队宣布正式上线Qwen3,并开源了8款「混合推理模型」,这标志着编程智能体的进一步发展。此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、220多亿激活参数),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);还有六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
Qwen3的旗舰模型Qwen3-235B-A22B在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,展现了极具竞争力的结果。这一成就不仅证明了Qwen3在技术上的先进性,也为其在实际应用中的广泛使用奠定了基础。
通义灵码团队还宣布,Qwen3模型已经可以在VSCode、Visual Studio、JetBrains IDEs等主流IDE的灵码插件中体验。这意味着开发者可以立即在熟悉的开发环境中利用Qwen3的强大功能,提升编程效率和质量。
Qwen3模型支持两种思考模式:思考模式和非思考模式。思考模式下,模型会逐步推理,经过深思熟虑后给出最终答案,适合复杂问题;非思考模式下,模型提供快速、近乎即时的响应,适用于简单问题。这种灵活性使用户能够根据具体任务控制模型的“思考”程度,实现稳定且高效的“思考预算”控制能力。
此外,Qwen3模型支持119种语言和方言,为国际应用开辟了新的可能性。这一广泛的多语言能力让全球用户都能受益于Qwen3的强大功能。
在Agent能力方面,Qwen3在评估模型Agent能力的BFCL评测中创下了70.8的新高,超越了Gemini2.5-Pro、OpenAI-o1等顶尖模型。这将大幅降低Agent调用工具的门槛。同时,Qwen3原生支持MCP协议,并具备强大的工具调用能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架,大大降低了开发者编码工作的复杂度。
通义灵码即将上线的编程智能体将支持开发者配置自己的MCP工具,并集成魔搭MCP广场,开发者也可以一键下载MCP服务。这一举措将进一步推动编程智能体的发展,为开发者提供更强大的工具支持。
下载链接:(https://lingma.aliyun.com/download)。