72B

阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama
感谢在今天的 2024 云栖大会上，阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5，其中，旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架 100 多个模型。Qwen2.5 语言模型：0.5B、1.5B、3B、7B、14B、32B …
应用
- 7
- 0
汪淼9月19日
开源 AI 大模型“洗牌”：阿里通义千问 Qwen2-72B 成“王者”，傲视 Meta Llama-3、微软 Phi-3 等群雄
感谢Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文，表示阿里云开源的通义千问（Qwen）指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。Hugging Face 公布了崭新的开源大谈话模型排行榜，通过 300 片英伟达 H100 GPU，重新运行 MMLU-pro 等标准评价目前支流的大谈话模型，并在其要点介绍中称…
AI
- 38
- 0
故渊6月28日
斯坦福大模型评测榜 Claude 3 排名第一，阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
斯坦福大学前提模型研究中心（CRFM）6 月 11 日发布了大规模多任务说话理解能力评价（Massive Multitask Language Understanding on HELM）排行榜，其中综合排名前十的大说话模型中有两款来自中国厂商，分别是阿里巴巴的 Qwen2 Instruct（72B）和零一万物的 Yi Large（Preview）。据悉大规模多任务说话理解能力评价（MMLU on…
AI
- 21
- 0
满河（实习）6月22日
阿里云通义千问系列 AI 开源模型升至 Qwen2：5 个尺寸、上下文长度最高支持 128K tokens
感谢通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下：5 个尺寸的预训练和指令微调模型，席卷 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B在中文英语的…
AI
- 17
- 0
故渊6月7日