英伟达赢麻了!马斯克xAI超等算力工场曝光,10万块H100、数十亿美元

英伟达:尽管建,用的还是我的芯片,最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相加入巨额财力打造超等计算机(或大规模 GPU 集群)。他们认为,更弱小的计算能力是兑现更弱小 AI 的关键。早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超等计算机「AI Research SuperCluster」(RSC),它由 760 个英伟达 DGX A100 系统组成,共有 6080 块 GPU,性能非常弱小。如今,马斯克旗下人工智能初创公司 xAI 传出了打造超等计算机的消息。据外媒 The

英伟达:尽管建,用的还是我的芯片,

最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相加入巨额财力打造超等计算机(或大规模 GPU 集群)。他们认为,更弱小的计算能力是兑现更弱小 AI 的关键。

早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超等计算机「AI Research SuperCluster」(RSC),它由 760 个英伟达 DGX A100 系统组成,共有 6080 块 GPU,性能非常弱小。

如今,马斯克旗下人工智能初创公司 xAI 传出了打造超等计算机的消息。

据外媒 The Information 报道,最近马斯克向投资者透露,xAI 筹划建设超等算力工场「Gigafactory of Compute」,为 AI 谈天机器人 Grok 的下一个版本提供算力支持。

英伟达赢麻了!马斯克xAI超等算力工场曝光,10万块H100、数十亿美元

据悉,xAI 筹划将 10 万块 H100 专用 GPU 串联一台超等计算机,其规模至少是当前最大 AI 集群的四倍。如果 xAI 的筹划能够顺利完成,这台超等计算机将消耗数十亿美元和大量电力。

不过,马斯克似乎很有信心,他的目标是在 2025 年秋季之前让这台超等计算机「跑」起来,并亲自负责按时交付。

当然,xAI 不想单打独斗, 其有望与甲骨文公司(Oracle)合作建设超等计算机。我们知道,xAI 是 Oracle 最大的 H100 服务器芯片租赁客户,已经使用了后者超过 1.5 万块 H100 芯片。

届时,xAI 超等算力工场建成之后,10 万块 GPU 芯片集群将加速 Grok 谈天机器人的开发,减少语音限制。目前,Grok 的最新版本为 Grok 1.5,该版本兑现了长上下文理解和高级推理能力,可以处理 128K token 的长上下文窗口。

而据马斯克此前透露,xAI 正在训练的 Grok 2 已经消耗了约 2 万块 H100 GPU,未来进阶版本 Grok 3 可能需要高达 10 万块 H100 GPU。看来,马斯克已经在为 Grok 3 未雨绸缪了。

英伟达赢麻了!马斯克xAI超等算力工场曝光,10万块H100、数十亿美元

最后,对于超等算力工场而言,最关键的找到一个电力充沛(可能需要 100MW)的位置。因此,AI 数据中心位置的选择非常重要。

至于建成的意义是什么?这个规模庞大的超等算力工场将帮助 xAI 追赶 OpenAI、微软等资金更为雄厚的竞争对手。

此前同样据 The Information 报道,微软和 OpenAI 拟加入超 1000 亿美元打造一个数据中心项目,其中包括一台「星际之门」(Stargate)的 AI 超等计算机,配备了数百万个专用服务器芯片,旨在为 OpenAI 兑现 AGI 提供动力。

英伟达赢麻了!马斯克xAI超等算力工场曝光,10万块H100、数十亿美元

其实,这也不是马斯克第一次加入超算项目。此前,特斯拉就被曝出到 2024 年底,加入远超 10 亿美元打造一台「Dojo 项目」的内部超等计算机,用于处理数据和视频,提高自动驾驶能力并最终兑现完全自动驾驶。

此次, 马斯克又在大语言模型领域斥巨资建设超等计算机。有人表示,如果消息属实的话,这将成为游戏改变者。当然,英伟达是最大的赢家。

参考链接:

https://www.theinformation.com/articles/musk-plans-xai-supercomputer-dubbed-gigafactory-of-compute?rc=ks2jbm

给TA打赏
共{{data.count}}人
人已打赏
应用

MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」

2024-5-27 15:15:00

应用

模块化重构LLaVA,交换组件只需增添1-2个文献,开源TinyLLaVA Factory来了

2024-5-27 15:39:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索