天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用

xxn 阅读:94166 2025-01-06 12:01:53 评论:0

IT之家 1 月 6 日报道称,昆仑万维集团今日宣布,天工大模型 4.0 o1 版和 4o 版已经同步上线,完全免费提供给用户,可在网页端和 App 端进行使用。

天工大模型 4.0 o1 版被誉为国内首个具备中文逻辑推理能力的 o1 模型,不仅涵盖了上线即开源的模型,还推出了两款性能更强的专用版本。该模型能够熟练解决各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。

天工大模型 4.0 4o 版则是一款多模态模型,官方还推出了经天工大模型强化的实时语音对话助手 Skyo,这是一个具备“情感表达能力、快速响应能力、多语言流畅切换”功能的智能语音对话工具。

IT之家从官方获悉,Skywork o1 拥有三阶段自研训练方案:

推理反思能力训练:Skywork o1 通过自家多智能体系统构建高质量的分步思考、反思和验证数据。通过大规模使用自我蒸馏和拒绝采样,对基础模型进行进一步预训练和监督微调,显著提升了模型的训练效率和逻辑推理能力。

推理能力强化学习:Skywork o1 团队开发了最新的适用于分步推理的 Skywork o1 Process Reward Model(PRM)。实验表明,Skywork-PRM 能够有效地捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响,进一步加强模型的推理和思考能力。

推理 planning:依托天工自家研发的 Q * 线上推理算法,与模型在线思考结合,找到最佳推理路径。这次运用 Q * 算法并公开是全球首次。Q * 算法的应用极大地提升了模型的线上推理能力。

相关阅读:

广告声明:文中包含的外部链接旨在提供更多信息,方便用户节省时间,仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容