AI在线 AI在线

华为模型

英伟达含量为零:华为密集模型盘古 Ultra 性能比肩 DeepSeek-R1,纯昇腾集群训练

华为利用纯昇腾集群训练出的盘古 Ultra,在数学竞赛、编程等推理任务当中,和 R1 打得有来有回。关键是模型参数量只有 135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。
4/15/2025 12:18:14 PM
汪淼
  • 1