Google发布Gemini Live 可实现双向对话 同时展示 Astra 项目

摘要:

今天,在 2024 年Google I/O 大会上,该公司宣布推出Gemini Live功能。该功能将让你与Gemini移动应用对话,对话视频功能也将很快成为阿斯特拉计划的一部分。那么,Gemini Live 和 Project Astra 到底是什么呢?该功能将从Gemini应用程序的语音图标启动,该应用程序在 iOS 和 Android 上都有提供。然后,你将获得一个全屏体验,并且会有一个非常整洁的音频波形图案,让你可以与聊天机器人进行双向对话。

Astra.png

Gemini Live 和 Project Astra 只是Google在展示其人工智能实力,但这仅仅是个开始。

为确保尽可能自然,您可以按照自己的节奏说话,Google也会根据您的节奏进行调整。然后,所有输入内容都将由Gemini进行解释。有十种不同的声音可供选择,如果你正在寻找与众不同的声音,那么它就是你的最佳选择。

Screenshot-2024-05-13-at-10.25.51 PM-1.webp

比方说,你正在准备工作面试或排练重要演讲:只要进入直播间,让Gemini帮你准备。Gemini会向你建议在与潜在雇主交谈时可以突出的技能,或者在走上讲台前平复紧张情绪的公众演讲技巧。

该功能将在未来几个月内推出,Gemini高级用户可以使用。然而,事情并没有就此结束,Google 还确保该功能更加强大。今年晚些时候,用户就可以在和Gemini Live对话时使用相机,随时拍摄周围的事物展开对话。

Google在现场活动中展示的另一个非常有趣的东西是"阿斯特拉计划"(Project Astra)。这是Google DeepMind 的一部分,其基本目标是建立一个通用的人工智能代理,在日常生活的几乎所有方面为你提供帮助。它将能够与你实时推理,并轻松提供快速回复。

Screenshot-2024-05-13-at-10.24.06 PM-1.webp

Google表示,要想真正发挥作用,代理需要像人一样理解复杂多变的世界并做出反应--接收并记住自己的所见所闻,从而理解上下文并采取行动。此外,它还需要具有主动性、可教性和个性化,这样用户才能自然地与它交谈,而不会出现滞后或延迟。

Google甚至展示了 Project Astra 的工作原理,它的性能和速度给人留下了深刻印象。

查看评论
created by ceallan