英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。

近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。

AI在线获悉,DeepSeek Janus 模型集成了多模态理解和生成功能。该模型首次采用统一的 Transformer 架构,突破了传统 AIGC 模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支持。在此基础上,Janus Pro 通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了 10 亿参数和 70 亿参数两个版本

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

英特尔 Gaudi 2D 凭借 2.45TB / 秒的高带宽和 96GB HBM 大容量内存,为 Janus Pro 模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。

与此同时,结合英特尔 Optimum-Habana 框架的优化,英特尔 Gaudi 2D 显著提升了文生图任务的吞吐性能和推理效率,仅需约 10 秒即可生成 16 张高质量的图片。而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本。此外,DeepSeek 的蒸馏模型在至强和 Gaudi 平台上也得到了支持。

相关资讯

英特尔放大招:新制程、能效核一起上,144核的至强6,性能成倍提升

今日,英特尔推出英特尔® 至强® 6能效核处理器,每个 CPU 拥有多达 144 个内核,机架密度提高达3倍1,以高性能、高密度、高能效和低TCO,满足多样的云级工作负载,是数据中心高效能之选。随着企业业务云化和大语言模型等人工智能应用的爆发,社会对算力的需求正飞速增长,对数据中心提出了前所未有的要求,包括更强的计算力、更大的存储容量和更高的网络带宽等。同时,算力规模的增大也给数据中心带来越来越高的能源等成本支出。在 “双碳” 目标驱动下,数据中心亟需通过持续变革实现算力提升和能耗降低的双重目标,同时保持低碳运营。

英特尔前 CEO 基辛格力挺 DeepSeek:将推动 AI 普及

基辛格认为,DeepSeek 的出现应该让科技行业牢记三个最重要的教训:降低成本意味着更广泛的采用;在限制条件下,创造力会蓬勃发展;“开放即胜利”。他指出,DeepSeek 将有助于打破基础 AI 模型工作日益封闭的局面。

英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用

英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手(英特尔酷睿 Ultra 独享版)上,率先在端侧支持了 DeepSeek-R1 模型,支持翻译、会议纪要、文档撰写等功能。