英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

2025-02-01 10:01

近日，DeepSeek 发布 Janus Pro 模型，英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化，为 AI 应用的落地和规模化发展提供的支持。

AI在线获悉，DeepSeek Janus 模型集成了多模态理解和生成功能。该模型首次采用统一的 Transformer 架构，突破了传统 AIGC 模型依赖多路径视觉编码的限制，实现了理解与生成任务的一体化支持。在此基础上，Janus Pro 通过优化训练策略和扩展模型规模，显著提升了文生图等功能的性能与稳定性，并提供了 10 亿参数和 70 亿参数两个版本。

英特尔 Gaudi 2D 凭借 2.45TB / 秒的高带宽和 96GB HBM 大容量内存，为 Janus Pro 模型提供了强大的计算支持，使其在生图批处理任务中，随着批量大小的增加，吞吐性能得到显著提升，大幅缩短任务处理时间。

与此同时，结合英特尔 Optimum-Habana 框架的优化，英特尔 Gaudi 2D 显著提升了文生图任务的吞吐性能和推理效率，仅需约 10 秒即可生成 16 张高质量的图片。而且，开发者仅需调整数行代码，即可实现这一结果，极大降低了开发门槛和迁移成本。此外，DeepSeek 的蒸馏模型在至强和 Gaudi 平台上也得到了支持。

英特尔放大招：新制程、能效核一起上，144核的至强6，性能成倍提升

今日，英特尔推出英特尔® 至强® 6能效核处理器，每个 CPU 拥有多达 144 个内核，机架密度提高达3倍1，以高性能、高密度、高能效和低TCO，满足多样的云级工作负载，是数据中心高效能之选。随着企业业务云化和大语言模型等人工智能应用的爆发，社会对算力的需求正飞速增长，对数据中心提出了前所未有的要求，包括更强的计算力、更大的存储容量和更高的网络带宽等。同时，算力规模的增大也给数据中心带来越来越高的能源等成本支出。在 “双碳” 目标驱动下，数据中心亟需通过持续变革实现算力提升和能耗降低的双重目标，同时保持低碳运营。

6/7/2024 2:27:00 PM

机器之心