清华团队开源大模型推理引擎“赤兔 Chitu”，实现 DeepSeek 推理成本降低一半、性能翻番

xxn 阅读：75022 2025-03-15 00:06:32 评论：0

根据 IT 之家 3 月 14 日的报道，清华大学高性能计算研究所翟季冬教授团队与清华系创业公司清程极智共同宣布，创新的大模型推理引擎“赤兔 Chitu”已经正式开源。

该引擎的突出特点在于它首次实现了在非 NVIDIA Hopper 架构的 GPU 和各种国产芯片上原生运行 FP8 精度模型，成功将 DeepSeek 的推理成本降低了50%，并将性能提升了一倍。其目标是成为“生产级大模型推理引擎”，并具备以下功能：

官方指出，在当前开源的赤兔引擎中，部署 DeepSeek-R1-671B 完整版时，在 A800 集群测试中，相较于部分国外开源框架，实现了 GPU 使用量减少50%的同时，推理速度提升了3.15倍。

如需访问开源项目，请见 IT之家提供的链接：https://github.com/thu-pacman/chitu

广告声明：文中所包含的跳转链接（例如超链接、二维码、口令等）旨在提供更多信息，以便节省您选择的时间，最终效果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。