微软研究院发布微软知识图谱 帮助机器概念化
据外媒报道,近日微软研究院发布了能帮助计算机更好运作的微软知识图谱(Microsoft Concept Graph),通过这个项目,机器可以更好地理解人类交流并且进行语义计算。最新的微软知识图谱由微软亚洲研究院的一组研究人员发布。
研究人员以“美洲豹”为例,解释人们看到这个词时通常会想起大型猫科动物,但计算机只能在数据库中查找相关数据。 微软亚洲研究院的资深研究员 Jun Yan表示:“我们希望能为机器提供一些常识性及更高层次的概念。”
经过长达6年的研究,微软亚洲研究院为Microsoft Concept Graph知识库增加了超过540万条概念。 研究人员首先对对机器算法进行训练,通过其在网页中及搜索查询中进行搜索。 该小组还特别关注“such as” 及“is a”等短语,来提高Concept Graph对人们搜索内容的理解。
更令人印象深刻的是,这种机器算法还能移除搜索结果中的虚假概念。 另外, Microsoft Concept Graph还能显示广告及识别特定的短语。
例如, Concept Graph能够将某些短语识别成单一实体。当查询‘微软亚洲研究院’时,Bing会首先出现‘微软亚洲研究院'相关的结果,优先于‘微软’、‘研究’和‘亚洲’等关键词。
此外,微软研究院还发布了Microsoft Concept Tagging 模型。