AI在线 AI在线

​Pruna AI 推出开源 AI 模型优化框架,助力高效压缩

作者:AI在线
2025-03-20 05:00
Pruna AI 是一家来自欧洲的初创公司,专注于 AI 模型的压缩算法开发。 近日,该公司宣布将其优化框架开源,以帮助开发者更高效地压缩和 AI 模型。 Pruna AI 开发的框架结合了多种效率方法,包括缓存、剪枝、量化和蒸馏等,旨在提升 AI 模型的性能。

Pruna AI 是一家来自欧洲的初创公司,专注于 AI 模型的压缩算法开发。近日,该公司宣布将其优化框架开源,以帮助开发者更高效地压缩和 AI 模型。

QQ_1742461212364.png

Pruna AI 开发的框架结合了多种效率方法,包括缓存、剪枝、量化和蒸馏等,旨在提升 AI 模型的性能。该框架不仅标准化了压缩模型的保存和加载,还能对压缩后的模型进行评估,以判断其质量是否显著下降,同时测量压缩带来的性能提升。

Pruna AI 的联合创始人兼首席技术官约翰・拉赫万(John Rachwan)表示:“我们的框架类似于 Hugging Face 对 transformers 和 diffusers 的标准化,我们为各类效率方法提供了一种统一的调用和使用方式。” 大公司如 OpenAI 已经在其模型中应用了多种压缩方法,例如使用蒸馏技术来创建其旗舰模型的更快版本。

蒸馏是一种通过 “教师 - 学生” 模型提取知识的技术,开发者向教师模型发送请求并记录输出。这些输出随后用于训练学生模型,使其能够近似教师模型的行为。拉赫万指出,虽然许多大公司倾向于自行构建压缩工具,但在开源社区中,往往只能找到基于单一方法的解决方案,而 Pruna AI 提供了一个整合多种方法的工具,极大地简化了使用过程。

目前,Pruna AI 的框架支持多种类型的模型,包括大型语言模型、扩散模型、语音识别模型和计算机视觉模型。但该公司目前主要集中于图像和视频生成模型的优化。已有如 Scenario 和 PhotoRoom 等企业在使用 Pruna AI 的服务。

除了开源版本,Pruna AI 还推出了一个企业版,包含高级优化功能和一个优化代理。拉赫万透露:“我们即将发布的最令人兴奋的功能是压缩代理,用户只需提供模型,并设定速度和准确度的要求,代理将自动找到最佳的压缩组合。”

Pruna AI 按小时收费,类似于用户在云服务上租用 GPU 的方式。通过使用优化后的模型,企业可以在推理时节省大量费用。例如,Pruna AI 成功将一个 Llama 模型的体积缩小了八倍,且几乎没有损失精度。该公司希望客户能够将其压缩框架视为一种投资,最终获得回报。

近日,Pruna AI 完成了650万美元的种子融资,投资者包括 EQT Ventures、Daphni、Motier Ventures 和 Kima Ventures。

项目:https://github.com/PrunaAI/pruna

划重点:

🌟 Pruna AI 推出开源优化框架,结合多种压缩方法提升 AI 模型性能。  

🤖 大公司常用蒸馏等技术,Pruna AI 提供整合多种方法的工具,简化使用流程。  

💰 企业版支持高级功能,帮助用户在保持准确度的前提下实现模型压缩和性能提升。

相关资讯

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等工具,可以让开发者实现「统一端边云,全端自动部署」,开启了机器学习开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与
3/19/2021 11:23:00 AM
机器之心

院士、委员、专家共议“双智建设”:场景驱动、标准协同、以人为本

智能网联汽车和智慧城市基础设施,已经成为日常生活中随处可见的元素。2021年,住建部和工信部将16个城市列为双智试点城市,探索智慧城市基础设施与智能网联汽车协同发展。试点城市提供了哪些思路?双智的未来该走向何处?这些问题成为当前双智行业关注的重点。近日,由腾讯智慧交通、腾讯研究院联合举办了“双智建设专家研讨会“,共同探讨双智建设的新思路、新机遇。中国工程院院士郭仁忠、全国政协委员、交通运输部科学研究院副院长兼总工程师王先进、中国电动汽车百人会秘书长兼首席专家张永伟、中国信息通信研究院副院长王志勤、中国城市规划设计研
3/15/2022 4:10:00 PM
新闻助手