Google推出迄今为止最便宜的AI模型 Gemini 1.5 Flash-8B

0 cnBeta.COM 2024-10-04 15:12:34

摘要：

自发布以来，Gemini 1.5 Flash 模型凭借其速度和成本效益迅速受到开发人员的青睐。今年 8 月，Google发布了 Gemini 1.5 Flash 8B，这是一个新的实验性人工智能模型，只使用 80 亿个参数，进一步降低了成本。

在过去几周与开发人员进行测试后，Google今天宣布发布可投入生产的 Gemini 1.5 Flash 8B，它可用于大容量多模态用例、长语境摘要任务等。与原来的 1.5 Flash 相比，新的 1.5 Flash 8B 型号成本降低了 50%，速率限制提高了 2 倍，小提示的延迟更低。

在性能方面，1.5 Flash 8B 的性能几乎与 5 月份推出的 1.5 Flash 型号相当。它尤其适用于聊天、转录和长文本语言翻译等任务。新机型的基准比较如下。

1728016237_gemini_1.5_flash_8b.jpg

这款全新 8B 机型的最大亮点在于其成本。双子座 1.5 Flash 8B 是Google迄今为止最便宜的人工智能机型。完整定价如下：

为了支持大容量人工智能应用，Google还提高了这一新型号的速率限制。 Gemini 1.5 Flash 8B 现在支持每分钟 4000 次请求（RPM），是之前限制的两倍。

感兴趣的开发者现在可以通过 Google AI Studio 和 Gemini API 免费试用新的 gemini-1.5-flash-8b 模型。对于付费级别的开发者，这种新模式的计费将从 10 月 14 日（星期一）开始。

Google新推出的 Gemini 1.5 Flash 8B 模型集性能、经济性和可访问性于一身，令人印象深刻，有望成为各领域开发人员的热门 AI 模型选择。

最新资讯