IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。

在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。首先,IBM 在 “按需部署”目录中提供了 Llama 蒸馏版,用户可部署专用实例以确保安全推理。其次,用户还可以通过 “自定义基础模型” 导入功能,上传 DeepSeek-R1的其他变体,例如 Qwen 蒸馏模型,从而满足多样化的应用需求。

DeepSeek

DeepSeek-R1具备强大的推理能力,适用于广泛的领域,为企业和开发者提供了高效且灵活的 AI 解决方案。此次更新进一步丰富了 watsonx.ai的模型生态系统,助力用户更便捷地开发和部署 AI 应用。

相关资讯

​IBM 与联想携手推进沙特阿拉伯生成式人工智能发展

在近期举行的 LEAP2025大会上,IBM 与联想宣布将进一步扩大两家公司之间的战略技术合作关系,旨在提升生成式人工智能在沙特阿拉伯的应用与影响力。 根据 IDC 的预测,到2026年,全球在人工智能相关系统上的年度支出将超过3000亿美元,沙特阿拉伯的众多领先组织也正在积极探索和投资生成式人工智能的应用场景,以应对即将到来的 “人工智能无处不在” 时代。 图源备注:图片由AI生成,图片授权服务商Midjourney此次合作将基于 IBM 与联想之间长达20年的伙伴关系,双方计划共同推出一系列 AI 解决方案。

DeepSeek称遭到大规模恶意攻击,注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

开源大模型领域,又迎来一位强有力的竞争者。近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。项目地址::DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V2 参数量达 236B,其中每个 token 激活 21B 参数,支持 128K token 的上下文长度。与