Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验

xxn 阅读:24059 2025-02-03 18:00:56 评论:0
衷心感谢IT之家网友 Anonymous_C 提供的线索!

据IT之家2月3日报道,Gitee AI于昨日正式推出了四款小型DeepSeek模型,分别是 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32B。其中,所有新上线的模型均基于国产沐曦曦云 GPU 进行部署

与更大尺寸的DeepSeek模型相比,这些小型DeepSeek蒸馏版模型更适合企业的内部部署,能够显著降低实施成本

此外,此次的DeepSeek R1模型、沐曦曦云 GPU 和 Gitee AI平台,展示了从芯片到系统,从算力到模型的完全自主研发能力

IT之家补充:DeepSeek R1是一款大型混合专家(MoE)模型,拥有6710亿个参数,支持128000个Token的大输入上下文长度。

此次部署在沐曦曦云 GPU 上的四个DeepSeek R1蒸馏模型,以极小的参数量实现了与大参数模型相当的性能表现。

目前,Gitee AI上的 DeepSeek-R1-Distill系列模型已经向所有开发者免费开放使用

广告声明:文中包含的外部链接(如超链接、二维码、口令等)旨在提供更多信息,帮助用户节约筛选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容