Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o

xxn 阅读:75734 2024-11-19 16:02:06 评论:0

近日,Mistral AI 公司发布了全新的多模态 AI 模型 Pixtral Large,拥有惊人的 1240 亿参数。这一模型基于 Mistral Large 2 框架,专门用于文本和图片处理。

Pixtral Large 已正式发布,并在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育和商业用途。

作为 Mistral AI 多模态家族的第二个成员,Pixtral Large 在各项标准多模态基准测试中表现卓越,特别是在 MathVista 测试中取得了 69.4% 的准确率,超越了其他竞争对手。

不仅在 MathVista,Pixtral Large 在 ChartQA 和 DocVQA 测试中也大放异彩,超越了 GPT-4o 和 Gemini-1.5 Pro。

Pixtral Large 配备了 123B 的多模态解码器和 1B 的视觉编码器,支持 128K 的上下文窗口,能够轻松处理多达 30 张高分辨率图像。这款 AI 模型不仅在视觉数据方面表现出色,还展现了强大的复杂推理和图表理解能力。

广告声明:本文包含的链接形式多种多样,在传递信息的同时也节省了您的时间。请知悉,内容仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容