OpenAI发布GPT-4o mini 奥尔特曼称两年时间模型成本下降了99%

相比2022年的text-davinci-003型号，GPT-4o mini的成本下降了99%。虽然OpenAI迟迟未发布下一代模型GPT-5，但在现有能力基础上，仍在更新模型，继续推动大模型成本下降。

当地时间7月18日，OpenAI发布了新款轻量级的大模型GPT-4o mini。据介绍，GPT-4o mini即日起将在问答机器人ChatGPT中取代GPT-3.5 Turbo，企业用户则能从下周起访问GPT-4o mini。

“我们预计GPT-4o mini将扩大人工智能的应用，让人工智能变得更实惠。”OpenAI官网文章称，GPT-4o mini的输入价格为15美分（0.15美元）/百万tokens（词元），输出价格为60美分（0.6美元）/百万tokens（约等于一本2500页的书），比GPT-3.5 Turbo便宜60%。

从模型能力看，OpenAI称，GPT-4o mini在行业基准测试MMLU（评估大规模多任务语言理解）中获得82%的分数，低于GPT-4o的88.7%，高于77.9%的Genmini Flash、73.8%的Claude 3 Haiku和69.8%的GPT-3.5 Turbo。GPT-4o mini在MGSM测试（评估数学推理）和MMMU测试（评估多模态推理）中，分别得分87%和59.4%，均超过Gemini Flash和Claude 3 Haiku，但低于GPT-4o。

此外，GPT-4o mini上下文窗口为128K tokens，支持输出16K tokens，知识更新至2023年10月。OpenAI介绍，GPT-4o mini还改进了处理非英语文本时的成本效益。GPT-4o mini能以较低成本和延迟执行广泛任务，如链接或并行多个模型调用（调用API接口）、将大量上下文输入给模型、通过快速的实时文本响应与人交互。

目前，GPT-4o mini可以生成文字和图像，未来将支持视频和音频。OpenAI计划还在未来几天推出GPT-4o的微调。

目前来看，GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo，并通过降低价格吸引用户。

OpenAI称，公司还将在提高模型性能的同时继续降低成本。相比2022年的text-davinci-003型号，GPT-4o mini的成本下降了99%。

“2022年全世界最先进的模型还是text-davinci-003，这个模型比现在的新模型差了很多，却贵了100倍。”OpenAI CEO萨姆·奥尔特曼（Sam Altman）在社交平台上表示。

其他大模型厂商今年也在推动模型轻量化，追求“小而美”。此前有大模型业内人士告诉记者，参数较小的大模型今年来展现了颇高的潜力，通过加大数据量而不是加大参数量的方式训练，模型性能还有很大提升空间，好处则在于轻量大模型的使用成本低，可以扩大使用。

谷歌今年5月也发布了轻量级模型Gemini 1.5 Flash。Anthropic 3月发布的Claude 3系列中，则包括轻量级的Claude 3 Haiku，在多项基准测试中Claude 3 Haiku的得分高于GPT-3.5、低于GPT-4。微软今年也在推动部署轻量级AI模型系列Phi。微软此前称，今年4月推出的Phi-3系列是市面上性能最强、最具性价比的“小语言模型”，最小版本的Phi-3-mini性能可超过参数规模高出一倍多的模型，成本可能只有类似功能的模型的十分之一。

从价格上看，Gemini 1.5 Flash每百万tokens起始价格为0.35美元，输出为1.05美元，Claude3 Haiku每百万tokens价格0.25美元，输出为1.25美元。GPT-4o mini的价格相对更便宜。