推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

xxn 阅读：91126 2024-11-21 00:00:42 评论：0

感谢IT之家网友 Skyraver 的线索投递！

IT之家 11 月 20 日消息，DeepSeek 宣布，全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

官方表示，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了卓越的推理效果，并为用户呈现了完整的思考过程。

DeepSeek-R1-Lite 预览版模型在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等评测中，胜过了其他知名模型。

DeepSeek-R1-Lite 的推理过程长，并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

▲ 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关

IT之家注意到，DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。

官方称正式版 DeepSeek-R1 模型将完全公开，并公开技术报告和部署 API 服务。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。