Google发布多模态Bard助理 交互式AI时代近了?
日前在新品发布会上,Google正式发布新一代Android旗舰手机Pixel 8 / Pro系列,搭载Tensor G3芯片,该芯片可运行更复杂的ML(机器学习)模型,为新机新增多项AI增强功能,例如用不同语言与“更自然”的声音为用户朗读网页,虚拟助理说话也更自然。
Google指出,Pixel 8 Pro是首款直接在设备上运行Google基础大模型的手机,其计算量是Pixel 7上最大的ML模型的150倍。
与此同时,Google宣布面向Android与iOS设备,推出“Bard助理(Assistant with Bard)”,将手机的个人助手功能与生成式AI相结合,用户可通过文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。
例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在Google地图中显示。
若用户想将一张小狗的照片发布到社交媒体上,只需召唤出Bard助理浮动对话框,并要求其撰写发布内容。Bard助理将在识别图像后,撰写相应内容。
Google表示,接下来很快将向早期测试人员推出Bard助理,以获取反馈;并在未来几个月内向公众推出。
另外,DeepMind联合创始人Mustafa Suleyman日前受访时表示,现阶段的生成式AI只是一个过渡性的技术阶段,接下来将进入交互式AI时代,AI将根据用户的不同任务需求,安排其他软件和或联系真人来完成工作。
他认为,第一波AI浪潮主要聚焦于分类(Classification)——深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未来的交互界面”,用户不仅仅是点击按钮和键入文字,而是与AI直接对话,届时交互式AI将能自主采取行动。
天风证券指出,C端AI应用落地阶段场景重要性凸显,聊天机器人、AI伴侣和内容生产工具场景最先落地,这些场景中的AI应用开发速度和商业化进展或超预期。
分析师预计,AI迭代和后期事件催化持续加速,下半年开始海外巨头应用和模型迭代速度提升明显,通用聊天机器人的能力有望进一步加强,或将带动用户体验的提升以及用户数的进一步增长。
另外,华金证券补充称,大模型从通用走向垂直场景更多的是对商业化落地的探索,是大模型从训练走向推理的动能。伴随着垂直大模型的发展完善,大模型的应用才是打开更大成长空间的关键。边缘计算是一个明确的巨大的增量市场,目前已经发展至行业落地阶段,云计算公司、电信运营商、设备厂商、CDN公司等都在积极推动产业落地。