C114通信网  |  通信人家园

人工智能
2025/4/18 15:09

谷歌首推Gemini 2.5 Flash:成本爆降600%

快科技  鹿角

据报道,谷歌发布了突破性混合推理模型Gemini 2.5 Flash,该模型创新性地引入可调节"思考预算"功能,在保持高性能的同时显著降低使用成本。

在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能思考模式(3.5美元/百万tokens)大幅降低600%。值得注意的是,即便在基础模式下运行,其性能依然超越前代Gemini 2.0 Flash。

性能表现方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二,仅次于GPT-4.5-preview,与Grok-3表现相当。

具体任务测试中,该模型展现出显著优势:在GPQA知识问答中,24K思考预算可带来6%的性能提升;在LiveCodeBench代码基准测试中,16K思考预算时达到最佳表现。

对比测试结果显示,Gemini 2.5 Flash在多模态推理和数学任务上明显优于Claude 3.7 Sonnet,综合性能与OpenAI最新o4-mini模型不相上下。在模拟人类综合能力的"人类最后一次考试"基准测试中,该模型以12.1%的高分位列第二,再次印证其强大实力。

此次发布的Gemini 2.5 Flash通过创新的"思考预算"机制,在性能与成本之间实现了突破性平衡,为AI应用开发提供了更灵活、更经济的选择。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141