C114通信网  |  通信人家园

人工智能
2024/11/19 15:16

Mistral发布Pixtral Large多模态AI模型:登顶复杂数学推理,图表/文档推理超过GPT-4o

IT之家  故渊

Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。

Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。IT之家援引官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。

 

 

在 ChartQA 和 DocVQA 测试中,Pixtral Large 同样表现优异,超越了 GPT-4o 和 Gemini-1.5 Pro。

该模型配备了 123B 的多模态解码器和 1B 的视觉编码器,支持 128K 的上下文窗口,能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色,同时在复杂推理和图表理解方面也具备强大能力。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141