黄仁勋自掏腰包50亿,开源英伟达GPU管理工具

离2025年只剩十几个小时,黄仁勋拿出50亿真金白银给大家发红包了! 他刚花7亿美金(51亿RMB)收购了一家初创公司,专门做GPU管理工具的。 并且立刻就宣布:开源所有平台和技术,买了英伟达GPU就能免费用。

离2025年只剩十几个小时,黄仁勋拿出50亿真金白银给大家发红包了!

他刚花7亿美金(51亿RMB)收购了一家初创公司,专门做GPU管理工具的。

图片

并且立刻就宣布:开源所有平台和技术,买了英伟达GPU就能免费用。

不愧老黄,花“小钱”办大事。

英伟达新收购

英伟达刚刚完成收购的这家公司,名字叫Run:ai,2018年成立,投资人包括著名的老虎基金、Insight Partners、红杉资本等等。

创业7年时间,Run:ai做的产品全部围绕一件事——怎么用GPU,当然不是个人PC,而是围绕AI、工业领域的训练计算任务,包括研发、管理、配置等等一系列工具。

图片

简单来说,Run:ai有一整套基于Kubernetes(谷歌的开源容器编排引擎)的开放平台,提供GPU管理工具。

对于开发者来说,ai Dev提供从概念到部署的过程开发工具。比如提供各种集成开发环境的工具、内置W&B、Comet.ml、MLflow等等工具追踪训练结果、提供训练数据集的管理工具…

所有这些功能,全都以最直观最“傻瓜”式的方式,清晰呈现在操作面板,所见即所得:

图片

另外,ai Dev还支持自动化分布式训练,一个命令行就可以将训练负载扩展到多个 GPU 节点…

其他的产品还包括ai Control Plane,也是可视化的面板,用来管理用户本地的GPU设施、在不同任务间一键分配算力资源、记录GPU的能耗成本等等功能:

图片

当然,Run:ai还提供了AI 工作负载调度程序,用户只用设置优先级和各项任务的配额,系统会自动优化资源分配。

目前Run:ai 的解决方案已经与NVIDIA DGX、NVIDIA DGX SuperPOD、NVIDIA Base Command、NGC containers和NVIDIA AI Enterprise软件等等产品集成。

总的来看,英伟达花7亿美金买的Run:ai,本质就是一个GPU的“数据产品经理”:提供业务看板、GPU权限分配、任务分配…等等直观可视化操作工具。

在收购同时,英伟达还宣布开源Run:ai的所有平台技术

图片

Run:ai的用户,包括全球打印机巨头斑马技术、用端到端技术一鸣惊人的自动驾驶公司Wayve、伦敦医学影像与人工智能中心等等。

举个简单的例子,Wayve通过Run:ai提供的工具,将原先不足25%的GPU集群效率,提升到80%以上。

对于有雄厚研发实力和AI积累的大公司来说,这样的内部工具自研不是问题,但对于中小规模、非AI行业的用户来说,Run:ai这一套不高深的技术,却很关键。

英伟达收购Run:ai,好处有什么?

回想一下2018年时,深度学习技术才刚刚在落地应用方面崭露头角。那时的英伟达市值只有1000多亿美元,主要产品还是20系列显卡,AI计算硬件也是基于RTX游戏显卡改的。

但就是在2018年,老黄第一次公开提出传统GPU已经到达极限,英伟达今后要战略转向:“重新发明图形处理器用于AI”,适应飞速增长的AI训练、研发需求。

现在看来,老黄在2018年做出了一项重塑AI、科技,甚至千行百业的重大决策。

图片

带着英伟达突破3万亿美元市值,也让技术没那么高深,但眼光独到的Run:ai水涨船高。

但问题是,老黄收购之后就立刻搞开源,有必要吗?

直接和Run:ai合作,赚企业的钱不是更好?

所以说黄仁勋是花小钱办大事呢~

现在的情况是,核心的GPU架构、性能本身,能威胁到英伟达的其实并不多。目前英伟达控制着高端芯片市场80%的份额,几乎100%的AI计算份额。

但老黄一直在寻求构建产品+生态的立体优势。

图片

比如在 2019 年斥资 69 亿美元收购了高性能计算公司 Mellanox,还收购了用于边缘 AI 工作负载的 OmniML、用于数据存储和管理的 SwiftStack 以及用于块存储的 Excelero。

另外英伟达还在硬件、软件、数据中心管理平台、机器人技术、安全分析和移动能力等方面进行了大量投资。

最广为人知的案例,应该就是当年试图以 400 亿美元收购英国芯片设计公司 Arm,但因为反垄断原因终止。

老黄一直在做的,就是AI行业的垂直整合,从芯片到工具再到软件应用,打造一个能满足任何AI用户的一站式商店。

买英伟达GPU,现在直接送“开箱工具”。

让AI创业公司更集中资源在主要业务,同时也给千行百业亟需被AI重塑的玩家扫除门槛。

移动互联网时代,苹果用这套打法登顶封神。

AI时代,英伟达直接Control C+V。

相关资讯