Cerebras 加速扩张六座数据中心,令推理速度提升十倍!

Cerebras Systems 近日宣布将在北美和欧洲新建六座数据中心,以提升其人工智能(AI)推理能力。 这一举措将大大增强公司的算力,支持各类 AI 应用的发展。 根据计划,85% 的计算能力将集中在美国,其中已有三座设施在加州的圣克拉拉、斯托克顿和德克萨斯州的达拉斯投入运营。

Cerebras Systems 近日宣布将在北美和欧洲新建六座数据中心,以提升其人工智能(AI)推理能力。这一举措将大大增强公司的算力,支持各类 AI 应用的发展。

根据计划,85% 的计算能力将集中在美国,其中已有三座设施在加州的圣克拉拉、斯托克顿和德克萨斯州的达拉斯投入运营。接下来,新中心将分别在明尼阿波利斯(预计2025年第二季度)、俄克拉荷马城和蒙特利尔(预计2025年第三季度),以及亚特兰大和法国(预计2025年第四季度)开张。

超级计算机 数据中心 (3)

图源备注:图片由AI生成,图片授权服务商Midjourney

新数据中心的核心将是 Cerebras 公司研发的 “晶圆规模引擎”(Wafer Scale Engine),这是一种专为 AI 应用优化的特殊芯片架构。公司表示,其 CS-3系统能够每秒处理4000万条 Llama-70B 模型的令牌数据,极大提升了推理任务的处理速度。在俄克拉荷马城的设施中,预计将配置超过300台 CS-3系统。该中心按照三级加三标准建设,具备抗龙卷风和地震的能力,并且配备了三重冗余电源,预计于2025年6月开始运营。

目前,已有多家知名 AI 公司与 Cerebras 签署了合作协议,包括法国初创公司 Mistral 及其 Le Chat 助手,还有 AI 问答引擎 Perplexity。HuggingFace 和 AlphaSense 也加入了使用 Cerebras 平台的行列。这项技术特别适合需要长时间计算和生成大量令牌的推理模型,如 Deepseek-R1和 OpenAI o3。

此次扩展是 Cerebras2025年整体扩张战略的一部分,一些设施将与阿联酋公司 G42合作运营。在蒙特利尔,由比特数字子公司 Enovum 管理的新中心预计将于2025年7月上线,其推理速度将比当前的 GPU 快十倍。

Cerebras Systems 是一家美国公司,专注于开发 AI 芯片,其独特的设计理念是将整个晶圆作为单个芯片来使用,目前已推出第三代晶圆规模引擎 WSE-3。该系统已在阿贡国家实验室、匹兹堡超级计算中心和葛兰素史克等机构中使用。尽管其技术具有优势,但也存在一定局限性,比如不支持原生 CUDA(Nvidia 的标准),以及在服务器兼容性方面不如 Nvidia 解决方案。

划重点:

🌍 Cerebras 计划在北美和欧洲新建六座数据中心,重点集中在美国,预计于2025年全面运营。  

⚡ 数据中心将采用独特的晶圆规模芯片,具备每秒处理4000万条令牌的能力。  

🤝 多家知名 AI 公司已与 Cerebras 达成合作,共同利用其高速推理能力。  

相关资讯

AI芯片公司Cerebras与Mistral合作,声称创速度纪录超DeepSeek

人工智能芯片公司 Cerebras Systems 于本周四宣布与法国开源 AI 技术公司 Mistral 达成合作,并帮助后者创造了新的速度记录。 Mistral 旨在与 Meta 和中国的 DeepSeek 等开源竞争对手抗衡,这些公司在上个月凭借低成本和卓越性能的技术震动了全球市场。 这三家公司都在与 ChatGPT 的开发者 OpenAI 展开竞争。

DeepSeek、OpenAI、Kimi 视觉推理哪家强,港中文 MMLab 推出推理基准 MME-COT

OpenAI o1 和 DeepSeek-R1 靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?

​Nvidia推新Dynamo软件,计划将DeepSeek的AI速度提升30倍

在3月18日的 GTC 大会上,Nvidia 首席执行官黄仁勋宣布了一项令人奋的计划,旨在通过新推出的软件 Dynamo,将 DeepSeek 的人工智能处理速度提高30倍。 此举是 Nvidia 对 DeepSeek 公司 R1人工智能程序引发的市场动荡的回应。 DeepSeek 的技术能够显著降低每个查询所需的计算量,导致投资者对 Nvidia 的未来前景表示担忧。