Google的下一代人工智能模型Gemini 1.5已基本准备就绪

0 cnBeta.COM 2024-02-15 23:10:27

摘要：

Google希望其大型语言模型"双子座"（Gemini）能将其带入人工智能行业的顶端，而在推出"双子座"仅两个月后，Google就宣布了其后续版本。Google今天发布了 Gemini 1.5 版，并向开发者和企业用户提供，很快将向消费者全面推广。该公司已明确表示，它将全力把 Gemini 打造成一个商业工具、个人助理，以及介于两者之间的所有工具，而且它正在大力推进这一计划。

Gemini 1.5 有很多改进：Gemini 1.5 Pro（Google系统中的通用模型）与该公司最近才推出的高端 Gemini Ultra 能力不相上下，而且在 87% 的基准测试中，它都优于 Gemini 1.0 Pro。它采用了一种越来越常见的技术，即"专家混合"（MoE），这意味着当你发送查询时，它只运行整个模型的一部分，而不是一直处理整个模型。这种方法能让用户更快地使用模型，也能让 Google 更高效地运行模型。

但是，Gemini 1.5 中的一个新功能让整个公司都特别兴奋：Gemini 1.5 有一个巨大的上下文窗口，这意味着它可以处理更大的查询，一次查看更多的信息。这个窗口高达 100 万个tokens，而 OpenAI 的 GPT-4 为 12.8 万个，目前的 Gemini Pro 为 3.2 万个。"这大约相当于是 10 或 11 个小时的视频，数万行代码"。上下文窗口意味着可以一次性向人工智能机器人询问所有内容。

Google CEO皮查伊还表示，研究人员正在测试一个 1000 tokens的上下文窗口--这就好比是将《权力的游戏》的整个系列同时播出，或者把整个《指环王》三部曲都放进这个上下文窗口中。

这允许在查询时添加大量个人上下文和信息，就像我们极大地扩展了查询窗口一样。

目前，Gemini 1.5 只能通过Google的顶点人工智能（Vertex AI）和人工智能工作室（AI Studio）提供给企业用户和开发人员。最终，它将取代Gemini 1.0，而Gemini专业版的标准版本--每个人都可以在gemini.google.com和公司的App中使用的版本将是 1.5 专业版，拥有128000 个tokens的上下文窗口，而需要支付额外的费用才能获得百万级的权限。Google还在测试该模式的安全性和道德底线，尤其是新增加的上下文窗口。

当全球企业都在试图制定自己的人工智能战略--以及是与 OpenAI、Google还是其他公司签署开发者协议时，Google正在为打造最好的人工智能工具而展开一场激烈的竞赛。就在本周，OpenAI 公布了ChatGPT的"记忆能力"，同时似乎准备进军网络搜索领域。到目前为止，Gemini 似乎给人留下了深刻印象，尤其是对于那些已经进入Google生态系统的人来说，但各方都还有很多工作要做。

最终，所有这些 1.0、1.5、Pro、Ultras 和企业之争对用户来说并不重要。人们将只需要感受AI，这就像使用智能手机，而不必总是关注手机里面的处理器是怎么工作的。

查看评论

今日最热

加载中...

最新资讯

今日最热