Google Photos推出人工智能搜索功能"Ask Photos"
随着Google双子座人工智能模型(Google Gemini AI model)支持的实验性功能"询问照片"(Ask Photos)的推出,Google Photos将获得人工智能的注入。这项新功能将于今年夏天晚些时候推出,用户可以使用自然语言查询,利用人工智能对照片内容和其他元数据的理解,并在Google照片集中进行搜索。
Google周二在其年度GoogleI/O 2024开发者大会上宣布,以前用户可以在照片中搜索特定的人、地点或事物,但由于有了自然语言处理技术,人工智能的升级将使用户更直观地找到正确的内容,减少人工搜索过程。
例如,你现在可以让人工智能做一些更复杂的事情,比如从"我去过的每个国家公园"中找出"最好的照片",而不是在照片中搜索"埃菲尔铁塔"这样的特定内容。人工智能会使用各种信号来确定照片中的"最佳"照片,包括光线、模糊程度、背景是否失真等。然后,它可以将这些信号与对一组照片或日期的地理位置的理解结合起来,只检索在美国国家公园拍摄的照片。
该功能基于Google照片最近推出的"照片栈"(Photo Stacks)。"照片栈"将近乎重复的照片组合在一起,并利用人工智能突出显示组中最好的照片。与"照片栈"功能一样,该功能的目的也是帮助人们随着数码收藏的增加找到自己想要的照片。据Google公司称,每天上传到Google照片中的图片超过 60 亿张,这足以说明其规模之大。
此外,"询问照片"功能还允许用户通过提问获得其他有用的答案。除了询问度假或其他群组中的最佳照片外,用户还可以提出一些需要对照片中的内容有近乎人类理解的问题。
例如,家长可以询问Google照片在孩子最近的四次生日派对中使用了什么主题,Google照片就会给出一个简单的答案,并提供有关美人鱼、公主和独角兽主题的照片和视频,以及使用时间。
之所以能实现这种查询,是因为Google照片不仅能理解你输入的关键字,还能理解自然语言概念,比如"主题生日派对"。它还能利用人工智能的多模态能力,了解照片中是否有可能与查询相关的文字。
首席执行官桑达尔-皮查伊(Sundar Pichai)在今天的Google I/O 开发者大会前向媒体展示的另一个例子显示,一位用户要求人工智能向他们展示孩子的游泳进展。人工智能打包了孩子游泳时的照片和视频集锦。
另一项新功能是利用搜索功能从照片中的文字中找到答案。这样,您就可以拍下您想记住的东西的照片,比如您的车牌号或护照号码,然后在需要时让人工智能检索这些信息。
如果人工智能弄错了,而你纠正了它--也许是标记了一张不是生日派对的照片,或者是一张你不会突出显示的度假照片--它会记住你的反应,并随着时间的推移不断改进。这也意味着,随着你与人工智能互动的时间越长,人工智能就会变得越个性化。
当你找到准备分享的照片时,人工智能可以帮助你起草标题,概括照片的内容。目前,这只是一个基本的摘要,并不提供不同风格的选择。
Google表示,它将在某些情况下设置不作出回应的防护措施,在训练模型时,它也不包含潜在的攻击性内容。但该功能是作为一项实验推出的,因此随着Google对人们如何使用该功能做出回应,可能还需要增加额外的控制措施。
"询问照片"功能最初将在美国支持英文版,然后再推广到更多市场。该功能目前还只是一个基于文本的功能,类似于向人工智能聊天机器人提问。不过,随着时间的推移,它可能会像在Android系统上一样,与设备上运行的 Gemini 进行更深入的整合。
该公司表示,Google照片中的用户个人数据不会被用于广告。Google表示,人类也不会审查Ask Photos中的人工智能对话和个人数据,除非"在极少数情况下处理滥用或伤害"。Google照片中的用户个人数据也不会用于训练任何其他生成式人工智能产品,比如Gemini。