豆包大模型发布各领域技术进展，首次披露 300 万长文本能力

xxn 阅读：39064 2024-12-30 22:00:24 评论：0

根据 IT之家在 12 月 30 日的报道，字节跳动旗下的豆包大模型于今日发布了 2024 年的全面技术进展。自自 5 月 15 日首次公开以来，经过 7 个月的发展，其在通用语言处理、视频生成、语音交互和视觉识别等领域的模型能力已跻身国际领先行列。

截至 2024 年 12 月，豆包最新的通用模型 Doubao-pro-1215 的综合能力较 5 月期间增长了 32%，已达到 GPT-4o 的水平，在应对数学和专业知识等较复杂任务上，其表现甚至优于 GPT-4o。同时，该模型的推理服务费用仅为 GPT-4o 的 12.5%。通过海量数据的优化及创新模型结构，如提高模型的稀疏性和引入强化学习，这一模型的理解精度和生成质量均有显著改善。

此外，豆包首次向外界披露了其大模型300 万字窗口的长文本处理能力，能够一次性轻松阅读“数百篇”学术报告，处理每百万 tokens 的延迟时间仅为 15 秒。根据 IT之家的了解，该能力依托于包括 STRING 在内的上下文关联数据算法，有效提升了 LLM 在利用海量外部知识方面的能力，并通过稀疏化和分布式方案将时延降低至十秒级别。

广告声明：文中包含的外部链接（包括但不限于超链接、二维码、口令等形式），旨在提供更多信息，帮助节省筛选时间，内容仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。