Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍

Cerebras Systems 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI 工作负载

Cerebras Systems 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。

Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍

Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍

除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI 工作负载提供 100 倍更高的性价比。

该方案将允许 AI 应用程序开发人员构建下一代 AI 应用程序,而不会影响速度或成本。该方案使用了 Cerebras CS-3 系统及其 Wafer Scale Engine 3(WSE-3)AI 处理器,其中 CS-3 的内存带宽是 Nvidia H100 的 7000 倍,解决了生成式 AI 的内存带宽技术挑战。

Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍

据AI在线了解,Cerebras Inference 提供以下三个层级:

免费层为登录的任何人提供免费的 API 访问和慷慨的使用限制。

开发者层专为灵活的无服务器部署而设计,为用户提供一个 API 端点,其成本只是市场上替代方案的一小部分,Llama 3.1 8B 和 70B 模型的定价分别为每百万 token 10 美分和 60 美分。

企业层提供微调模型、定制服务级别协议和专门支持。企业可以通过 Cerebras 管理的私有云或客户场所访问 Cerebras Inference,非常适合持续的工作负载。

Cerebras 团队称:“凭借创纪录的性能、业界领先的定价和开放的 API 访问,Cerebras Inference 为开放的 LLM 开发和部署设定了新标准。作为唯一能够同时提供高速训练和推理的解决方案,Cerebras 为 AI 开辟了全新的可能性。”

AI 领域正在迅速发展,虽然英伟达目前在 AI 市场占据主导地位,但 Cerebras 和 Groq 等公司的出现预示着行业动态可能发生变化。随着对更快、更具成本效益的 AI 推理解决方案需求的不断增加,这些挑战者在颠覆英伟达的霸主地位,尤其是在推理领域方面。

相关资讯

十二年穿越周期,“AIGC第一股”出门问问今日挂牌上市

4月24日,“AIGC第一股”出门问问有限公司(简称“出门问问”或“公司”,股份代号:2438),正式登陆香港交易所主板,股份代号为2438.HK,每手买卖单位1,000股股份。截至9:40,出门问问报于每股3.23港元,市值48.18亿港元。据配发结果公告显示,此次出门问问(02438.HK)全球发售8456.8万股股份,国际发售4228.4万股股份,公开发售4228.4万股股份,其中,公开发售获117.39 倍认购。最终发售价每股3.8港元,全球发售净筹约2.67亿港元。据悉,出门问问在招股期认购异常火爆,创下

联想与NVIDIA合作推出混合AI解决方案,提供量身定制的生成式AI

2024 年 3 月 18 日 – 今天,全球AI盛会GTC(GPU Technology Conference)2024正式开幕,联想集团与NVIDIA宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得在人工智能时代成功所需的关键的加速计算能力,将人工智能从概念变为现实。这些混合解决方案是双方共同工程合作的结晶,旨在用户最需要的地点和时间里,无论是口袋还是云端,高效地将人工智能带入客户数据中。此举将推进联想集团AI for All的愿景,并为下一代大规模生成式人工智能的创新架构迅速进入市场提供了支持。联

中控技术发布 Plantbot 方案:基于“AI + 机器人”技术,多维度实现智能化工厂运维

中控技术股份有限公司(下文简称中控技术)官方公众号于 9 月 23 日发布博文,结合 AI 和机器人两大元素,推出了 Plantbot 机器人解决方案。Plantbot 机器人解决方案针对流程工业中巡检环境的复杂性、统一调度的缺失以及巡检任务繁重等难题,特别为工业细分应用场景量身定制的机器人产品及软硬件平台解决方案。AI在线援引该方案主要有 3 大技术创新:基于多机器人复杂任务的多机协同控制平台:通过先进的算法优化与实时通信机制,实现了多个机器人在复杂环境下的高效协同作业。基于 AI 技术实现多传感器数据融合与建模