AI在线 AI在线

清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

作者:清源
2025-03-14 08:06
官方表示,当前开源的赤兔引擎在部署DeepSeek-R1-671B满血版时,在A800集群的测试中,相比部分国外开源框架,实现了GPU使用量减少50%的同时,推理速度的3.15倍提升。

清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。

据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性:

  • 多元算力适配:不仅支持 NVIDIA 最新旗舰到旧款的多系列产品,也为国产芯片提供优化支持。

  • 全场景可伸缩:从纯 CPU 部署、单 GPU 部署到大规模集群部署,赤兔引擎提供可扩展的解决方案。

  • 长期稳定运行:可应用于实际生产环境,稳定性足以承载并发业务流量。

官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% 的同时,推理速度提升 3.15 倍。

AI在线附开源地址:https://github.com/thu-pacman/chitu

相关标签:

相关资讯

清华大学 2025 年将适度扩招本科生,重点培养“AI+”拔尖创新人才

据新华社报道,从清华大学获悉,为服务国家战略需求和社会发展需要,该校计划在 2025 年有序扩大本科招生规模,新增约 150 个本科生招生名额。同时,清华大学将成立新的本科通识书院,旨在培养人工智能与多学科交叉的复合型人才。据悉,该校新增本科生将进入新成立的书院学习。
3/2/2025 3:31:13 PM
远洋

清华大学今年秋季学期起将推出 AI 辅修学位

继今年 3 月清华大学宣布适度扩招、成立新书院后,学校教学委员会近期审议通过了 AI 辅修学位培养方案,决定今年秋季学期起推出新的 AI 辅修学位。
4/14/2025 11:48:18 AM
清源

清华大学成立人工智能学院,图灵奖获得者姚期智任院长

清华大学今日宣布成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能 X”两个重点方向,以高定位和新机制建设中国自主的“AI 顶尖人才和原始创新基座”,为实现高水平科技自立自强提供有力支撑。IT之家获悉,清华大学人工智能学院首任院长由图灵奖获得者、中国科学院院士姚期智担任。据介绍,清华大学在人工智能人才培养和科学研究方面有着深厚的积累,是国内最早开展人工智能教学和科研的单位之一,一批清华校友现已成为我国人工智能产业的中坚力量。新成立的清华大学人工智能学院将立足国家战略布局,进一步创新人才培养模式,吸
4/27/2024 4:35:38 PM
浩渺