谷歌PaLM-SayCan模型可让机器人更好地理解自然语言并执行复杂任务
长期使用 Alexa、Siri、Google Assistant 等数字助理的朋友,或许已留意到这项技术正在变得愈加智能。与此同时,近年来的机器人技术也在突飞猛进。以谷歌为例,该公司有在演示一款乒乓球机器人,旨在训练其应对快速、自适应、且精确的任务挑战。Google 研究员接触科学家兼机器人技术负责人 Vincent Vanhoucke 表示:“在一鸣惊人之前,你必须勤学苦练”。
(图 via Haje Kamps)
在速度和精度之外,Google 还希望通过实验,攻克人类语言和机器人技术的交叉点。截至目前,这家科技巨头已在自然语言水平上取得了让人印象深刻的飞跃。
举个例子,你可能会对一个人说 ——“有空帮我从柜台拿一杯饮料吗?”
尽管对于人类来说,这句话的语境相当简洁。但是对于一台机器人来说,其中包含的信息量很可能将其绊倒。
因为‘有空’这词语可能不包含任何意义,也可能是趁着机器人正在干另一件时与之通过自然语言交互。
如果机器人过度理解了字面含义,它可能会回答一句‘当然可以’—— 即便用户并未明确要求它这么做。
若机器人更加钻牛角尖,它可能又会陷入该帮你拿哪一种饮料的纠结。
好消息是,Google 正在使用该公司的 NLP 系统拉解决一些问题。在 Pathways 语言模型(PaLM)的帮助下,机器人有望更准确地接收并理解人类的真实所想。
下一阶段的挑战,则是审视机器人能够切实做到哪些事情。比如让你让机器人拾取冰箱顶部的一瓶清洁剂时,它是否会小心安全地摆放到儿童不易接触到的地方。
不过在此之前,Google 还是会着眼于更加普适性的任务。简单的有‘向前移动一米’,稍微高级点的可以是‘去厨房拿一罐可乐’。
然后才是复杂多步任务的拆解执行,比如 ——‘啊哦,我不小心将可乐撒地板上了!能帮忙清理干净、并再给我拿一杯吗?’
对此,Google 选择的方案是利用语言“讲述”(Say)模型中所包含的知识,来帮助机器人确定并评估哪些高级指令“可否”(Can)派上用场。
在融汇了 PaLM 语言模型之后,Google 已将它重命名为 PaLM-SayCan,且正在自家实验室使用来自 Everyday Robots 的一些机器人(上图展示其已学会何时去充电休息)。
当然,在投入实际商用之前,这项技术显然还有相当多需要完善的地方,尤其是需要事先收集极其庞大的知识与技能数据集。