就在刚刚,英伟达正式完成了对以色列AI初创Run:ai的收购。
对于AI基础设施来说,Run:ai的软件至关重要——
通过动态调度、GPU池化、GPU分片等功能,硬件资源的使用效率可以得到大幅提升,甚至可以实现10倍的工作负载。
图片
不仅如此,随后Run:ai还计划将他们的软件开源。
这意味着所有平台的开发者都可以访问并利用这些源代码,来优化搭载诸如AMD、Intel等硬件的系统。
但具体的时间表和细节暂未披露。
图片
尽管双方都未确认交易金额,但据报道,英伟达为收购Run:ai支付了约7亿美元。
这一交易自4月宣布以来就备受关注,但过程中遇到了监管障碍。欧盟和美国司法部分别展开了调查,以评估英伟达的收购是否会形成垄断以损害竞争。最终,欧盟于12月批准了该交易。
完成收购不久,英伟达的股价便迎来了一小波上涨。
图片
英伟达的密切合作伙伴
Run:ai创始人Omri Geller和Ronen Dar在特拉维夫大学相识,并分别在Meir Feder教授的指导下攻读硕士和博士学位。
图片
图片
他们在研究中发现了行业中一个显而易见的趋势:机器学习和深度学习对算力的巨大需求通常超过了现有的基础设施所能提供的阈值。
为此,他们决定寻找解决方案,并共同创办了Run:ai。
图片
自2018年成立以来,Run:ai就一直专注于GPU调度技术,并致力于打造一个能将AI模型拆分并行运行的平台,无论硬件位于本地、云端还是边缘。
2020年,Run:ai推出了首款产品;同年,成为了英伟达的紧密合作伙伴。
而这一时间,正好与英伟达开始涉足AI领域(如深度学习超级采样DLSS)相吻合。
图片
如今,AI部署的复杂性日益增加,工作负载分布在云、边缘计算和本地数据中心,需要更高效的管理方式。
对此,Nvidia DGX云副总裁Alexis Bjorlin表示:「管理生成式AI、推荐系统、搜索引擎等工作负载,需要复杂的调度来优化系统和底层硬件的性能。」
Run:ai正是解决这一需求的关键。
它基于Kubernetes构建的开放平台,可在本地、云端或混合环境中帮助客户优化计算基础设施,支持多种Kubernetes变体,并无缝集成第三方AI工具和框架。
其平台提供:
- 管理共享计算资源的集中式界面,便于更快访问复杂的AI任务
- 用户管理、资源分配及资源监控功能
- GPU资源的动态分配和共享,支持部分GPU到多GPU、跨集群节点的高效利用
Run:ai的开源承诺
英伟达作为AI硬件领域的巨头,同时也一直在强化软件布局。
例如曾于2007年推出的封闭源CUDA软件如今依然独步江湖,让AMD的ROCm等开源对手望尘莫及。
这次收购Run:ai,英伟达更是将进一步整合硬件与软件,打造一个更加完整的生态闭环。
许多网友都认为,这次收购将会进一步增强英伟达的垄断地位。
图片
对此,Run:ai的创始人Omri Geller和Ronen Dar表示,这种情况不会发生。
正如开篇提到的,Run:ai将会开源自家的软件,作为英伟达竞争对手的AMD、Intel等硬件厂商也都能适配。
他们在声明中强调:「作为英伟达的一部分,我们将继续秉持我们的开放平台理念,赋能AI团队,让他们自由选择最适合自己需求的工具、平台和框架。我们将继续加强合作伙伴关系,并与整个生态系统共同努力,提供多种AI解决方案和平台选择。」
无论如何,英伟达此举无疑是AI领域的一步大棋。对AMD和Intel而言,原本就大的竞争压力又将倍增。
参考资料:
https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-finalizes-acquisition-of-ai-software-firm-run-ai-takes-software-open-source-company-reportedly-cost-usd700-million
https://www.run.ai/blog/run-ai-joins-nvidia