让人工智能(AI)更好地通过深度学习技术理解自然语言一直是该领域的重要难关,为此,研究者都想方设法地去训练人工神经网络。日前,剑桥大学的科研人员就想到了一个加强深度学习的新法子:让人工神经网络玩填字游戏。深度学习指的是,借助大量的数据来对几乎不具有什么知识基础的人工神经网络进行训练,从而让其掌握人类理解能力的一种手段。比如剑桥大学利用字典释义来训练这个应用程序一样。
据了解,科研人员设计出一个应用,让人工神经网络在此平台上进行标准的填字游戏问答。研究发现,该系统能够明白简单的短语、隐喻等抽象性表达,取得的成绩比市面上任何为填字游戏设计的软件都要好。而且,该系统的表现俨然一部“逆序词典”(把最后一个字相同的词语排列在一起,按照词语末位字的顺序来排列),能够根据给出的概念描述回答出特定意义的词语。
研究过程中,科研人员从六部字典以及维基百科词条中选取释义来进行大量的实例训练,希望能让系统理解字词、短语和句子等语义群——将释义作为字词和句子之间的桥梁,让其根据句子理解出字词。他们的研究成果指出,用类似的方式来进行训练,或同样能够提高那些语言理解和对话系统、信息检索引擎的信息输出效率。
剑桥大学计算机实验室研究员、本次研究的论文作者之一Felix Hill表示,训练计算机理解自然语言最大的挑战是,为计算机重建人类学习说话和阅读时接受到的丰富多样的信息源。
这建立数据库的事情其实听起来似乎也不是很难,难就难在,比如说,当系统遇到疑问或者数据库没有的信息时它就没辙了。人类可以依靠生活经验中获得的背景知识来推理,甚至是借助肢体语言等来辅助理解,但机器不能。
Hill认为,近来人工智能系统在深度学习上取得的进展可以概括为行为主义和认知主义。所谓行为主义,顾名思义,关注行为表现而忽略大脑和神经的作用;认知主义则着眼于构成行为的心理过程。像Hill他们搭建的这个深度学习系统就是一个认知学的反映。但是,对于一个以无限接近人类智力为目标的系统来说,必须具备两中方法论实践。