AI在线 AI在线

赤兔

清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

官方表示,当前开源的赤兔引擎在部署DeepSeek-R1-671B满血版时,在A800集群的测试中,相比部分国外开源框架,实现了GPU使用量减少50%的同时,推理速度的3.15倍提升。
3/14/2025 8:06:51 PM
清源
  • 1