豆包大模型发布各领域技术进展,首次披露 300 万长文本能力
根据 IT之家 在 12 月 30 日的报道,字节跳动旗下的豆包大模型于今日发布了 2024 年的全面技术进展。自自 5 月 15 日首次公开以来,经过 7 个月的发展,其在通用语言处理、视频生成、语音交互和视觉识别等领域的模型能力已跻身国际领先行列。
截至 2024 年 12 月,豆包最新的通用模型 Doubao-pro-1215 的综合能力较 5 月期间增长了 32%,已达到 GPT-4o 的水平,在应对数学和专业知识等较复杂任务上,其表现甚至优于 GPT-4o。同时,该模型的推理服务费用仅为 GPT-4o 的 12.5%。通过海量数据的优化及创新模型结构,如提高模型的稀疏性和引入强化学习,这一模型的理解精度和生成质量均有显著改善。
此外,豆包首次向外界披露了其大模型300 万字窗口的长文本处理能力,能够一次性轻松阅读“数百篇”学术报告,处理每百万 tokens 的延迟时间仅为 15 秒。根据 IT之家 的了解,该能力依托于包括 STRING 在内的上下文关联数据算法,有效提升了 LLM 在利用海量外部知识方面的能力,并通过稀疏化和分布式方案将时延降低至十秒级别。
广告声明:文中包含的外部链接(包括但不限于超链接、二维码、口令等形式),旨在提供更多信息,帮助节省筛选时间,内容仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。