全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

仅仅过了一天,阿里开源的新一代推理模型便能在个人设备上跑起来了! 昨天深夜,阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B,其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。 基准测试数据显示,QwQ-32B 在数学推理、代码生成及通用任务处理能力上实现了显著突破,充分展现了强化学习应用于预训练基础模型的巨大潜力。

仅仅过了一天,阿里开源的新一代推理模型便能在个人设备上跑起来了!

昨天深夜,阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B,其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

基准测试数据显示,QwQ-32B 在数学推理、代码生成及通用任务处理能力上实现了显著突破,充分展现了强化学习应用于预训练基础模型的巨大潜力。

图片

QwQ-32B 与原始 DeepSeek-R1、DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 的基准测试结果比较。

可以说,QwQ-32B 的开源不仅代表着大模型技术的又一次飞跃,更预示着「最强模型」走入个人设备的时代正式到来。

然而,这只是模型一侧的改进。对于大多数人来说,高性能大模型的部署门槛一直居高不下,常面临着「存不下、跑不动、散不了热、供不起电」等诸多挑战,是阻碍个人用户体验前沿技术的最大障碍。

不过大模型时代,技术的进步永远很快。

这不,一家利用闲时 GPU 算力资源支持科学研究和 AI 推理并获得收益的平台「算了么」,为普通用户体验并一键部署阿里最新推理模型提供了便捷途径。全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

                            备注:参照此一键部署 DeepSeek-32B 的视频,也可一键部署 QwQ-32B。

全球首发:3090 显卡跑 QwQ-32B 只需几步

此次,「算了么」平台首个推出了 QwQ-32B 模型在个人电脑上的一键部署方案,只需简单几步即可轻松体验比肩 DeepSeek-R1 的强大推理能力。

这意味着,普通人也能分分钟把这几百亿参数的模型跑起来,完全不用懂代码,门槛极低。

图片

实测数据显示,在消费级 RTX 3090 显卡上,QwQ-32B 模型的推理速度可达 30-40tokens/秒。流畅高效得到保证,可以完全满足日常使用场景。

图片

当然,没有 90 系显卡的用户也无需担忧。

目前,「算了么」平台基于共享的资源,将 QwQ-32B 以免费 API 和 Chat 的方式提供给广大用户,欢迎试用!当然,平台也呼吁身边有 90 系显卡设备的同学,可以共享出来给更多人使用。

图片

  • 免费 API 获取:qwq.aigpu.cn

  • 免费试用 Chatbot:aigpu.cn

开启个人算力共享新纪元

一键部署只是开胃菜,算力普惠是「算了么」平台想要实现的更长远目标。

作为国内领先的分布式算力共享平台,「算了么」通过一种全新的方法破解算力不均衡问题——其支持用户在部署模型之后,在空闲不用时选择将本地算力共享给社区的用户使用,并可以获取一定的积分收益。

图片

一边是排队使用 GPU 的项目,另一边是大部分时间闲时的算力,一个平台解决两边的问题。这就是「算了么」平台一直以来的做法——降低算力使用门槛,释放个人设备潜能。

具体来讲,平台利用动态闲时资源,构建安全稳定的分布式计算网络,目前已经接入超万台个人电脑、数十万台网吧的闲时算力资源,为灵活、临时的弹性算力需求提供安全、稳定、低价的算力服务。

此前已有非常成功的落地案例,2024 年 10 月,「算了么」平台利用百余台共享个人电脑设备,为清华大学 AI 课堂上的 100 多位学生提供了长达 2 个多小时的在线稳定算力服务。此举不仅验证了弹性共享算力的可行性和稳定性,也为未来普惠 AI 教育、算力生态建设提供了典型示范样本。

图片

平台官网:suanleme.cn

团队介绍

「算了么」团队拥有深厚的学术和技术背景,核心成员来自清华大学、北京大学以及 Intel、字节跳动等知名企业。 

团队在分布式资源调度领域深耕多年,曾获 2024 年中国国际大学生创新大赛亚军(金奖,创业组冠军),并已获得奇绩创坛、水木创投等知名机构的投资。

图片

早在平台创立之初,「算了么」团队就敏锐洞察到大模型发展的两大趋势:「小型化」与「分布式」。两者均对当前大模型的实际应用落地具有重要的推动作用。

团队坚信,随着模型技术的不断演进,大模型将不再是少数巨头的专属,而是遵循密度定律不断「小型化」,在更小算力下释放更强能力。同时,分布式算力将成为支撑未来 AI 发展的关键基础设施,个人算力的价值将得到前所未有的凸显。

图片

「算了么」平台正是基于这一前瞻性认知而生,致力于构建开源、普惠、共赢的算力生态,让每一份个人算力都能汇聚成推动 AI 发展的强大力量。

随着单卡跑最强模型的时代已经到来,「算了么」平台期待广大开发者、AI 爱好者的踊跃加入,共同开启个人算力共享新篇章!

相关资讯

阿里最新深度思考模型强不强?我们让它和Grok3比拼了下

AI好好用报道编辑:杨文又来了一个深度思考模型。 昨天,阿里 Qwen 团队发了个博客,标题就是:乍一看,还以为电脑卡出了乱码,但再往下一瞅,里头大有「乾坤」,因为这篇博客:不是人写的。 而是出自阿里最新深度思考模型 QwQ-Max-Preview 之手。

推理水平对标OpenAI o1!阿里云通义开源最新推理模型QwQ

11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。 评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。 QwQ(Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的AI推理模型。

阿里发布类o1模型QWQ,可自我反思纠错,实测数学推理远超o1、DS-R1,人人免费;网友:OpenAI除了商标,没有护城河

编辑 | 言征阿里真的是开源模型界的扛把子,这次把类o1模型的预览版也公开推出了,现在大家都可以直接在抱抱脸上体验又一个国产版的万能推理机了! 小编迫不及待地马上尝试了两个高中奥数题,一道数列题、一道概率题,这解题思路堪称完美闭环。 全对!