华为云AI原生基础设施CloudMatrix亮相全联接大会

今天,在华为全联接大会 2024 上,华为云发布了 AI 原生云基础设施架构 CloudMatrix,以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。华为云 AI 原生云基础设施架构 CloudMatrix 正式发布如今,AI 算力需求高速增长,正在超越对通用算力的需求。构建弹性、高效的多元算力基础设施是 AI 发展的关键。为了进一步提升 AI 原生基础设施的效能,华为云推出 AI 原生云基础设施 CloudMatrix,将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,构建「一切可池化

今天,在华为全联接大会 2024 上,华为云发布了 AI 原生云基础设施架构 CloudMatrix,以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。

华为云AI原生基础设施CloudMatrix亮相全联接大会华为云 AI 原生云基础设施架构 CloudMatrix 正式发布

如今,AI 算力需求高速增长,正在超越对通用算力的需求。构建弹性、高效的多元算力基础设施是 AI 发展的关键。

为了进一步提升 AI 原生基础设施的效能,华为云推出 AI 原生云基础设施 CloudMatrix,将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,构建「一切可池化、一切皆对等、一切可组合」的分布式对等全互联架构,实现了单体算力向矩阵算力的演进,为客户提供澎湃的 AI 算力。

一切可池化:华为通过 CPU、NPU 为客户提供强大的通用计算和智能计算。同时,华为云分布式 QingTian 技术帮助突破单服务器的能力边界,将服务器内的 CPU、NPU、DPU、存储和内存等多样资源的统一池化并灵活配置,以此形成大规模、紧耦合的多元算力池化架构,算力得到大幅提升。

一切皆对等:CloudMatrix 通过超高带宽 ScaleUp 网络从「传统以太网」向「共享总线以太网」演进,实现池化算力的高速互联,同时通过自适应拓扑感知打破集群线性度瓶颈。华为云在传统算力集群 ScaleOut 网络基础上,结合 ScaleUp 超高带宽网络,将资源互联带宽提升了一个数量级。新的网络协议实现跨物理服务器的统一标识、统一的访问和消息通信机制。从而实现 CPU、NPU、存储 内存等多样资源的跨服务器统一池化。通过资源全部对等连接,既可以水平扩展,更可以垂直扩展,打破计算集群线性度的瓶颈,能够降大模型训练集群的线性度提升至 95%,网络故障分钟级恢复。

一切可组合:CloudMatrix 可以按需组合多样化算力资源,并且根据应用需求灵活调整。在统一多元算力逻辑池化、高速全对等互联的基础上,通过瑶光智能云脑对云上资源进行多元算力统一建模、灵活调度组合,按需提供给应用。覆盖大模型和小模型的训练和推理,同时,还能够用在数据分析、媒体内容生成等更多应用场景。

华为云宣布,基于 CloudMatrix 的新一代昇腾 AI 云服务将于年底上线。

相关资讯

华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI

9 月 19-21 日,以「共赢行业智能化」为主题的第九届华为全联接大会(HUAWEI CONNECT 2024)在上海举办。活动期间,腾讯音乐娱乐集团(TME)天琴实验室 AI 大模型负责人吴斌博士在华为云峰会发表主题演讲。天琴实验室自研创新的 MUSELight 大模型推理加速解决方案与华为云昇腾 AI 云服务深度合作共建,并首次对外发布 Stable Diffusion 系列视觉大模型推理加速方案 lyraSD 的昇腾适配方案。吴斌博士表示,双方共同努力实现了 AI 算力的自主创新和领先突破,讲为用户提供更美

华为云董理斌:做难事解难题,盘古大模型以“智”重塑千行万业

7 月 5 日,2024 世界人工智能大会暨人工智能全球治理高级别会议 —“盘古大模型重塑千行万业” 分论坛于上海世博中心举办。在 “盘古大模型做难事解难题,以‘智’重塑千行万业” 主题演讲中,华为云 Marketing 部部长董理斌向出席会议的百余名人工智能领域顶尖专家、业界领军人物分享了盘古大模型 5.0 的全新能力,以及盘古大模型深入高铁、钢铁、工业设计、建筑设计、气象等领域,重塑千行万业的应用进展。他表示,盘古大模型 5.0 通过更多的模态和更强的思维能力,重塑云服务,为开发者、客户和伙伴提供更强大、更丰富

「东数西算」再添重要节点,华为云芜湖数据中心正式开服

华为云在芜湖建设数据中心,与贵州贵安、内蒙古乌兰察布一起构成了华为云的算力“铁三角”,基于先进技术构建了“AI算力一张网”。