众所周知,机器在理解自然语言的时候不免会遇到一些歧义句,像是“放弃美丽的女人”,包含“一个放弃了美丽容颜的女人”和“一个男人放弃了美丽的女人”两层含义,这样一来,机器就只能识别出其中的一种,在搜索中,机器也就只能搜索出这一种。同时,机器搜索如果遇到修辞句时将遇到同样的问题。所以,很多时候我们搜索的内容可能文不对题。
Twitter一向以为消费者服务为宗旨,所以,为了解决搜索结果不够精准这个问题,Twitter公司工程师做出了一个伟大的决定:使用人工辅助搜索。
当然,Twitter公司肯定不会帮助人工辅助搜索所有的条目,在今日发布的Twitter官方开发博客中,开发人员指出这一技术将主要用于对新近出现的流行词汇进行人工标注,具体实现步骤如下
我们将监视流行词汇,利用Twitter的Storm拓扑技术来跟踪数据并进行调查。当我们认定流行词汇之后,将送交亚马逊土耳其机器人匿名人工服务中进行标注。人工辅助搜索随后将上线,帮助用户更精准地进行搜索。比如“大鸟”一词经过人工辅助搜索标注之后,与政治有关,用户以后在搜索的时候,我们就可以将显示广告限制在政治范围内,不会出现日用品广告,而是出现@奥巴马等。
这一人工辅助搜索标注功能的实现要得益于“土耳其机器人”项目中的工人的手工标注。据称这一人工辅助搜索标注过程非常快,几乎可以达到实时更新,减少人工干预的耗时延迟问题。