千问

阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama

感谢在今天的 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,其中,旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 72B;Qwen2.5-Coder 编程模型:1.5B、7B 以及即将推出的 32B;Qwen2.5-Math 数

阿里云通义千问 Github 页面 404,负责人回应称没有跑路、突然被官方标记

感谢阿里云通义千问 QwenLM 的 Github 页面今日突然出现 404 访问错误,包括 Qwen2.0 在内的项目均无法正常访问。对此,阿里高级算法专家,通义千问团队负责人林俊旸在朋友圈表示,团队没有跑路,目前也不知道原因。他表示:“这运气也是没谁了。没有跑路,我们还在,就是 github org 被无端端 flag,所以你们看不到内容,我们已经在联系官方。如果万能的票圈有办法帮忙加速请告诉我,谢谢。”林俊旸还在 X 平台发文称,GitHub 昨晚出于未知原因突然标记了通义千问的组织,他正在尝试向 GitHu

消息称阿里通义千问大模型技术负责人周畅将离职创业

感谢据 36 氪报道,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。报道称,周畅目前还在阿里云系统中,尚未正式离职。但该媒体从多方独立信源处得知,周畅已确定要创业。一位消息人士表示,周畅或将投身于 AI 应用领域。而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云 CTO 周靖人。截至AI在线发文,阿里云官方尚未进行回应。通义千问于 2023 年 4 月首次公布,目前已更新到 2.5 版本,号称

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%,一元 200 万 tokens

字节跳动 5 月 15 日正式发布了豆包大模型,宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云紧随其后抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,降幅 97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。参考IT之

阿里云通义千问 2.5 大模型发布,号称“多项能力赶超 GPT-4”

感谢在今日上午的阿里云 AI 智领者峰会-北京站活动中,通义千问 2.5 大模型发布,号称多项能力赶超 GPT-4。据阿里云官方介绍,通义大模型通过阿里云服务企业超 9 万,通义开源模型累计下载量突破 700 万。通义落地应用进程加速,现已进入 PC、手机、汽车等领域。在活动现场,阿里云正式发布通义千问 2.5,号称“能力升级,全面赶超 GPT-4”,在中文语境下,文本理解、文本生成、知识问答 & 生活建议、闲聊 & 对话和安全风险等多项能力上赶超 GPT-4。此外,通义千问 2.5 相比通义千问 2.1 有多项能

阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源

感谢4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到,通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。此次开源的 320 亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。例如,相比通义千问 14B 开源模型,32B 在智能体场景下能力更强;相比通义千问 72B 开源模型,32B 的推理成本更低。通义千问团队希望 32B 开源模型能为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了 7 款大语

通义千问开源320亿参数模型,已实现7款大语言模型全开源

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实

通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地

阿里云 x 联发科,天玑 9300 等手机芯片适配端侧通义千问大模型

感谢联发科宣布已成功在天玑 9300 等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下运行多轮 AI 对话。阿里云方面表示,将和联发科深度合作,向全球手机厂商提供端侧大模型解决方案。IT之家注意到,通义千问目前已开源 18 亿、70 亿、140 亿、720 亿参数等大语言模型,以及视觉理解、音频理解多模态大模型。阿里云在去年 10 月还发布了通义千问 2.0,模型参数达到千亿级别。联发科自己也在研发大语言模型,曾推出开源的 MR Breeze-7B 模型,擅长处理繁体中文和英

阿里通义千问重磅升级:免费开放1000万字长文档处理功能

3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。比如在金融领域,上传一份公司财报,通义千问即可自动提取和总结公司各业务的营收情况和利润增长等核心信息,生成公司整体业绩表现的总结。上传公司不同时期的财报后,通义千问可生成公司在这一阶段内的业务变化、业绩趋势并进行财报

AI拜年火了,通义千问上线一张照片生成拜年视频

2月5日,春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法,共提供超300套照片模板,用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照;此外,一个月前火爆全网的全民舞王应用也迎来上新,用户可通过一张照片生成拜年视频,用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费「拍」全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破时空阻碍,用最便捷的方式相聚、庆祝,春节团圆的仪式感拉满。在通义千问APP照相馆应用的全家福

超越LLama2,通义千问登顶HuggingFace开源大模型排行榜榜首

12月8日消息,全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜,阿里云通义千问力压Llama2等国内外开源大模型登顶榜首。HuggingFace的开源大模型排行榜(Open LLM Leaderboard)是目前大模型领域最具权威性的榜单,收录了全球上百个开源大模型,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。通义千问(Qwen-72B)表现抢眼,以73.6的综合得分在所有预训练模型中排名第一。通义千问-72B登顶HuggingFace的Open LLM Leade

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。当天,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。
  • 1