DeepSeekR1
华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1
华为技术有限公司今日宣布,MindSpeed 支持 DeepSeek V3 预训练、微调,同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。
支付宝百宝箱智能体开发平台接入DeepSeek R1满血版
今日,支付宝百宝箱智能体开发平台宣布已正式接入DeepSeek R1满血版模型,面向所有用户开放,支持不限额免费构建智能体。 这一举措标志着支付宝在AI技术应用方面迈出了重要一步,将为广大开发者和用户带来更加便捷、高效的智能体验。 据悉,此次接入的DeepSeek R1模型具备强大的思维链推理能力,能够完整保留推理过程,便于用户理解和分析。
七彩虹推出 “虹光 AI” 助手接入全速版 DeepSeek
七彩虹科技正式宣布,其全新的 “虹光 AI” 智能模型助手已全面接入满血版 DeepSeek R1模型。 这一升级使得七彩虹的笔记本产品在性能和推理效率上得到了显著提升。 此次更新的 “虹光 AI” 助手,基于当前热门的 Transformer 架构,并采用了 MLA 与 Deep Seek MoE 技术,显著降低了内存占用,减少了缓存需求,从而提升了整体的推理效率。
阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
- 1