Google推出迄今为止最便宜的AI模型 Gemini 1.5 Flash-8B
自发布以来,Gemini 1.5 Flash 模型凭借其速度和成本效益迅速受到开发人员的青睐。 今年 8 月,Google发布了 Gemini 1.5 Flash 8B,这是一个新的实验性人工智能模型,只使用 80 亿个参数,进一步降低了成本。
在过去几周与开发人员进行测试后,Google今天宣布发布可投入生产的 Gemini 1.5 Flash 8B,它可用于大容量多模态用例、长语境摘要任务等。 与原来的 1.5 Flash 相比,新的 1.5 Flash 8B 型号成本降低了 50%,速率限制提高了 2 倍,小提示的延迟更低。
在性能方面,1.5 Flash 8B 的性能几乎与 5 月份推出的 1.5 Flash 型号相当。 它尤其适用于聊天、转录和长文本语言翻译等任务。 新机型的基准比较如下。
这款全新 8B 机型的最大亮点在于其成本。 双子座 1.5 Flash 8B 是Google迄今为止最便宜的人工智能机型。 完整定价如下:
每 100 万个词元 0.0375 美元的提示价格
提示符每 100 万个词元 0.15 美元
缓存提示每 100 万个词元 0.01 美元
为了支持大容量人工智能应用,Google还提高了这一新型号的速率限制。 Gemini 1.5 Flash 8B 现在支持每分钟 4000 次请求(RPM),是之前限制的两倍。
感兴趣的开发者现在可以通过 Google AI Studio 和 Gemini API 免费试用新的 gemini-1.5-flash-8b 模型。 对于付费级别的开发者,这种新模式的计费将从 10 月 14 日(星期一)开始。
Google新推出的 Gemini 1.5 Flash 8B 模型集性能、经济性和可访问性于一身,令人印象深刻,有望成为各领域开发人员的热门 AI 模型选择。