开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄

感谢Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文,表示阿里云开源的通义千问(Qwen)指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。Hugging Face 公布了崭新的开源大谈话模型排行榜,通过 300 片英伟达 H100 GPU,重新运行 MMLU-pro 等标准评价目前支流的大谈话模型,并在其要点介绍中称 Qwen2-72B 为“王者”,并表示中国的诸多开源模型在榜单上有一席之位。他表示,为了提供崭新的开源大模型排行榜,使

感谢Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文,表示阿里云开源的通义千问(Qwen)指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。

开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄

Hugging Face 公布了崭新的开源大谈话模型排行榜,通过 300 片英伟达 H100 GPU,重新运行 MMLU-pro 等标准评价目前支流的大谈话模型,并在其要点介绍中称 Qwen2-72B 为“王者”,并表示中国的诸多开源模型在榜单上有一席之位。

他表示,为了提供崭新的开源大模型排行榜,使用了 300 块 H100 对目前全球 100 多个支流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基准测试集上进行了崭新评价。

阿里巴巴开源的 Qwen-2 72B 模型在激烈竞争中脱颖而出,不仅逾越了科技巨头 Meta 的 Llama-3,还逾越了法国知名大模型平台 Mistralai 的 Mixtral,成为了新的行业领军者。IT之家援引官方博文附上榜单排行如下:

排名新的榜单排名⭐Qwen/Qwen2-72B-Instruct2meta-llama/Meta-Llama-3-70B-Instruct3microsoft/Phi-3-medium-4k-instruct401-ai/Yi-1.5-34B-Chat5CohereForAI/c4ai-command-r-plus6abacusai/Smaug-72B-v0.17Qwen/Qwen1.5-110B8Qwen/Qwen1.5-110B-Chat9microsoft/Phi-3-small-128k-instruct1001-ai/Yi-1.5-9B-Chat

给TA打赏
共{{data.count}}人
人已打赏
AI

专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容过失

2024-6-28 7:10:36

AI

OpenAI 与《期间》达成合作和谈:可用其杂志实质训练 ChatGPT

2024-6-28 8:13:42

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索