通义千问

阿里发布 Qwen-Agent 框架,赋能开发者构建复杂 AI 智能体

阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent,基于现有 Qwen 语言模型,支持智能体执行复杂任务,并提供多种高级功能,赋能开发者构建更强大的 AI 智能体。

AI 编程能力哪家强?阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 最新推出 CodeElo 基准测试,通过和人类程序员对比的 Elo 评级系统,来评估大语言模型(LLM)的编程水平。

阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考

阿里通义千问 Qwen 团队今天(12 月 25 日)发布博文,宣布基于 Qwen2-VL-72B 构建,推出 QVQ-72B-Preview 开源视觉推理模型,能够像物理学大师一样,面对复杂的物理问题,沉着冷静地通过逻辑推理找到解决方案。

吴泳铭:阿里已发布超 100 个开源模型,超 30 万家企业接入通义大模型

据其介绍,目前已有超过30万家企业接入通义大模型,利用 AI 技术重塑代码开发、药物研发、生产制造等多个行业。

阿里巴巴 CEO 吴泳铭:通义千问 API 调用价格一年下降 97%

吴泳铭透露,过去一年,阿里巴巴在 AI 基础设施方面进行了高强度投入。得益于规模效应和技术进步,算力成本持续降低。其中,阿里大模型“通义千问”的 API 调用价格在一年内降幅高达 97%,百万 token 调用成本最低已降至 0.5 元。他认为,“就像足够便宜的电力带来电气化时代的大爆发,足够便宜的算力终将把我们带进智能化时代”。

阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒

阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI 模型。

阿里通义代码模式上线:号称即便不懂编程,也能大白话一键生成应用

通义代码模式基于 Qwen2.5-Coder 模型开发,官方表示即便用户不懂代码和编程,也可用大白话让通义 AI 自动编码,网站、数据图表和小游戏等。

阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o

阿里通义千问此前开源了 1.5B、7B 两个尺寸,本次开源带来 0.5B、3B、14B、32B 四个尺寸,覆盖了主流的六个模型尺寸。

先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了

这才是未来 AI 该有的样子?  奇怪了。 一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。

最受欢迎开源大模型,为什么是通义?

开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。 大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。 随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。

真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟

5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在成为低门槛的设计工具。昨天,阿里云完成了「可能是历史上最大规模的模型开源发布」,开源了通义千问 Qwen2.5 系列模型,又在云栖大会的年度重磅发布中

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o

人工智能领域再度迎来重磅消息! 2023 年 8 月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。 在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。                              发布现场,图源:泽南通义千问凭借不

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT-4o Mini;通义千问大模型技术骨干周畅将离职创业丨AI情报局

今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一,双方合作推出了名为 Anthology Fund 的 1 亿美元人工智能初创基金,旨在投资于人工智能领域的种子前、种子和 A 轮公司。 该基金将为初创企业提供从 10 万美元起步的投资,并提供 25 万美元的信用额度以使用 Anthropic 的模型。 Menlo 将利用其自家的机器学习工具来评估和排名申请,并承诺对表现出色的公司进行后续融资的支持。

阿里云CTO周靖人:阿里云百炼服务客户数从9万增长至23万,涨幅超150%

7月5日,在上海世界人工智能大会上,阿里云CTO周靖人公布近期通义大模型和阿里云百炼平台的最新进展。 近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。 周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。

阿里Qwen2正式开源,性能全方位包围Llama-3

Qwen 系列会是众多大学实验室新的默认基础模型吗?斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。HuggingFace 平台和社区负责人 Omar Sanseviero 曾表示,AI 社区一直在「忽视」中国机器学习生态系统的工作,他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情,如 Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、Inter

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香

在发布一周年之际,阿里云通义千问大模型在闭源和开源领域都交上了一份满意的答卷。国内的开发者们或许没有想到,有朝一日,他们开发的 AI 大模型会像出海的网文、短剧一样,让世界各地的网友坐等更新。甚至,来自韩国的网友已经开始反思:为什么我们就没有这样的模型?这个「别人家的孩子」就是阿里云的通义千问(英文名为 Qwen)。在过去的一年里,我们经常能够在 X 等社交平台上看到它的身影。这些帖子一般有两个主题:通义千问又开源新模型了!通义千问新模型还挺好用!还有人以通义千问为例,反驳中国在人工智能方面落后的说法。而且,这一反

通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。除此以外,今天 Qwen 1.5 的发布还有如下一些重点:支持 32K

多模态大模型,阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力,最近有了大幅提升。2024 年,大模型领域要卷什么?如果没有思路的话,不妨看看各家大厂都在押注什么方向。最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上,发布的 Gemini 成为了业界第一个原生的多模态大模型,它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。很明显,新的方向就是多模态。继 GPT-4 在语言方向的里程碑式突破之后,业界普遍认为「视觉」是下一个爆发的赛道。毕竟人类的五感之中有 80