英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交付延迟

据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对能否按计划部署 Blackwell 服务器感到担忧。

IT之家 11 月 18 日消息,当地时间周日,据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对能否按计划部署 Blackwell 服务器感到担忧。

知情人士透露,Blackwell GPU 专为 AI 和高性能计算(HPC)设计,但在配置 72 个处理器的服务器中出现过热问题,此类服务器每个机架功耗最高可达 120 千瓦。过热问题迫使英伟达多次修改机架设计,不仅限制了 GPU 性能,还可能损坏硬件。客户因此担心,这些技术问题会延迟数据中心的处理器部署进程。

为应对这一难题,英伟达要求供应商调整机架设计,并与合作伙伴一起优化散热系统。尽管这种工程改进是大规模技术发布中的常规步骤,但也进一步推迟了产品交付时间。

英伟达发言人针对此事对路透社回应称,公司正与云服务提供商密切合作,设计调整属于正常研发流程的一部分。英伟达希望通过这种合作,确保最终产品在性能和可靠性方面达到预期,同时加紧解决技术瓶颈。

IT之家从报道中获悉,修订后的 Blackwell GPU 于今年 10 月底才进入量产,预计最快明年 1 月底出货。谷歌、Meta、微软等科技巨头依赖英伟达 GPU 训练其最强大的 AI 模型,其延期对这些客户的研发计划和产品发布造成的影响自然是不可避免。

今年 3 月,英伟达展示了 Blackwell 芯片,当时曾表示将在第二季度发货。

相关阅读:

  • 《黄仁勋称英伟达 Blackwell 芯片曾存在设计缺陷,靠台积电力挽狂澜》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关资讯

英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍

「这才是我理想中的 GPU。」—— 黄仁勋。「这不是演唱会。你们是来参加开发者大会的!」老黄出场时,现场爆发出了巨大的欢呼声。今天凌晨四点,加州圣何塞,全球市值第三大公司英伟达一年一度的 GTC 大会开始了。今年的 GTC 大会伴随着生成式 AI 技术爆发,以及英伟达市值的暴涨。相对的是,算力市场也在升温,硬件和软件方面的竞争都在加剧。而英伟达带来的产品,再次将 AI 芯片的标杆推向了难以想象的高度。「通用计算已经失去动力,现在我们需要更大的模型,我们需要更大的 GPU,更需要将 GPU 堆叠在一起。」黄仁勋说道。

全球最强GPU芯片已量产、下一代Rubin曝光,老黄继续打破摩尔定律

黄仁勋:我家的 GPU 芯片一年一更新,其他家怎么追?昨晚,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。                               经典皮肤(皮衣)老黄亮相。在会上,黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。量产版 Blackwell 亮相下一代 AI 平台 Rubin 两年后到来今年 3 月,英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 B

100%英伟达的错:黄仁勋确认Blackwell缺陷修复,明年初出货

老黄:科技公司的芯片需求让我夜不能寐。 「我们的 Blackwell 芯片存在设计缺陷,虽然可以正常使用,但该设计缺陷导致良率低下,」黄仁勋表示。 「这 100% 是英伟达的错。