Gemini 2.5 Flash 重磅登场：首推混合推理模型思考模式可关成本暴降 600% - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 00:06:58

Gemini 2.5 Flash 重磅登场：首推混合推理模型思考模式可关成本暴降 600%

发布日期:2025-04-18 14:31:14 稿源：网易科技

Google发布首个混合推理模型 Gemini 2.5 Flash，支持可调节“思考预算”功能，可开启或关闭深度推理模式，降低使用成本。目前，Gemini 2.5 Flash 预览版已集成至 Gemini 产品，并面向开发者开放 API 接入。

据介绍，在关闭思考模式下，Gemini 2.5 Flash 的输出价格低至0.6美元/百万 tokens，相比开启思考模式（3.5美元/百万 tokens）降低600%。Google称即便在关闭思考的情况下，新模型性能仍优于上一代 Gemini 2.0 Flash。

该模型在多个基准测试中刷新 SOTA 纪录。Gemini 2.5 Flash（预览版）在大模型排行榜中以1392分 ELO 位列第二，仅次于 GPT-4.5-preview，表现与 Grok-3旗鼓相当。

在 GPQA 知识问答任务中，模型设定24k 思考预算可提升性能6%；在代码基准 LiveCodeBench 上，性能在16k 思考预算下表现最佳。

在数学（AIME 2025/2024）、多模态推理（MMMU）、知识问答（GPQA）等任务上，Gemini 2.5 Flash 明显超越 Claude 3.7 Sonnet，综合性能可与 OpenAI 最新 o4-mini 模型匹敌。

此外，在通用基准“人类最后一次考试”中，Gemini 2.5 Flash 以12.1% 高分表现仅次于 o4-mini。

查看网友评论返回完整版观看

最新资讯

加载中...

任天堂正评估推出OLED版“Switch 2”的可能性

麻省理工与洛桑联邦理工学院研发出首款可潜水、能飞行的仿生机器鸟

三星Galaxy Z Fold 8 Ultra真机上手：折痕几乎看不见

美国科技业裁员加剧近七成民众支持将AI公司50%股权“充公”

微软CEO暗讽Anthropic等公司：抱怨蒸馏是虚伪的

问界汽车巨额亏损赛力斯A/H股均跌超10%

三星将首次量产卷轴屏新机型定名Galaxy Z Slide

苹果对OpenAI打响“热核战争” 诉讼能否守住iPhone时代？

苹果芯片研发进程曝光：M8系列已在研发预计采用1.4纳米制程并具备更强AI能力

苹果M7 Ultra芯片内存容量或达1.5TB 有望实现本地运行万亿参数大模型

账户被盗遭微软拒绝恢复巴西玩家诉诸法律终获胜诉并获赔

今日最热

加载中...

苹果M7 Ultra芯片内存容量或达1.5TB 有望实现本地运行万亿参数大模型

苹果M7与M8芯片的强大性能被指与此前造车项目的研究有关

苹果芯片研发进程曝光：M8系列已在研发预计采用1.4纳米制程并具备更强AI能力

传苹果将加速芯片换代周期：M6系列仅六个月重心转向M7

PS5模拟器已在开发中仍处于非常早期阶段

初创公司Spectral Compute开发可在AMD硬件上运行的新型CUDA编译器

西非黑猩猩出现罕见的向树木丢石块行为科学家探寻背后深意

Anthropic延长Claude Fable 5模型付费用户访问权限至7月19日

科技行业裁员浪潮加剧多数美国劳动者支持设立人工智能财富基金

诺兰回应《奥德赛》争议这些批评从来都不重要

账户被盗遭微软拒绝恢复巴西玩家诉诸法律终获胜诉并获赔

返回上一页首页 | cnbeta报时: 00:06:58

文字版标准版电脑端

© 2003-2026