美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升

xxn 阅读:35906 2025-03-07 20:02:40 评论:0
感谢 IT之家网友 HH_KK天擎 提供的线索!

IT之家于 3 月 7 日报道,美团搜推机器学习团队在 3 月 4 日发布了最新的开源成果,实现了 DeepSeek R1 模型的基本无损 INT8 精度量化。

DeepSeek R1 的原始模型权重采用 FP8 数据格式,对所支持的 GPU 型号要求严格,仅兼容英伟达的新一代 GPU(如 Ada 和 Hopper 架构),其他类型的 GPU(例如 A100)无法直接进行部署。

目前,量化代码已纳入开源 LLM 推理框架 SGLang,并在 Hugging Face 社区发布了量化模型,以便用户进行使用。官方测试显示,满血版 DeepSeek R1 在 A100 上基于 INT8 量化,相较于 BF16 版本提升了 50% 的吞吐量。

IT之家提供开源链接如下:

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

广告声明:文中包含的外部链接(包括超链接、二维码、口令等形式)用于提供更多信息,帮助用户节省查询时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容