返回上一页
首页
| cnbeta报时: 09:24:13
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
查看网友评论
返回完整版观看
最新资讯
加载中...
欧洲多国将接回涉疫邮轮人员 世卫组织评估传播风险仍“较低”
《午夜凶铃》原著作者铃木光司去世 享年68岁
《极限竞速:地平线6》太大 玩家抱怨2TB SSD勉强够用
哈啰员工聚会“脚踩青桔、美团单车”合照 公司回应
塌房的快递驿站行业 来了个搅局的狠人
特朗普撮合苹果重返英特尔代工 25%晶圆价格优势撬动台积电垄断现状
墨西哥城正被地面“吞噬” NASA雷达实时追踪下沉危机
蟹类为什么横着走?这可能源自2亿年前一次进化事件
美阿联酋联合建设5GW算力AI园区首批200MW即将上线
NVIDIA今年已承诺投入400亿美元押注AI股权投资
你看到的完美“买家秀” 可能是假的
今日最热
加载中...
曝AMD显卡在中国竟是在亏本大甩卖
刘强东深夜现身福州路边摊 嗦螺蛳粉狂炫小龙虾
央视网曝光8家车企因锁电被约谈 网传名单中车企集体否认
传统密码不再安全 微软呼吁全面转向通行密钥
开启收费,字节养不起豆包了?
一年多部烂片 视觉团队被连锅端 漫威为何成了迪士尼的“弃子”?
曝DeepSeek融资500亿 梁文锋或自投200亿
“泰国孕妇坠崖案”王暖暖控诉无忧传媒:长期霸凌、PUA
售价或超4000 定位全球第二 王自如要做智能指环了
深圳现身24小时啤酒“交易所” 价格随人气起落的自助酒吧
“大空头”伯里警告AI狂热或接近尾声 当前市场酷似2000年科技股泡沫前夕
返回上一页
首页
| cnbeta报时: 09:24:13
文字版
标准版
电脑端
© 2003-2026