返回上一页
首页
| cnbeta报时: 13:47:52
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
碟中谍系列上映第30年 电影《碟中谍8:最终清算》曝“重燃热血”预告
育碧重启《雷曼》3A企划 探索阶段后迈入新纪元
《马里奥赛车:世界》开发长达8年 原为初代Switch开发
黄仁勋遇104岁老人问长寿秘诀:原来全天下男人的爱好一样
戴森展示新款超薄吸尘器PencilVac 与吹风机一样纤薄
Character AI 的聊天机器人是否受言论保护?法院对此表示怀疑
遭遇员工连番抗议后 微软屏蔽含有“巴勒斯坦”字样的电子邮件
这款微型机器人无需双腿就能跳10英尺高
计算机科学家发现了英特尔处理器的严重漏洞 每秒超过5000字节读取内存内容
多地出现狗拉车带人上路急驶 律师:或违法违规
AMD官宣:ROCm将完整降临Windows 消费级显卡也能发布即支持
今日最热
加载中...
穷途末路的芯片教父,以巨贪14亿收场
演员朱媛媛去世 丈夫辛柏青发讣告
网约车司机充电时不开窗车内睡觉 结果再没醒来
小米YU7内饰官曝:配天际屏全景显示 视觉效果震撼
消息称王自如计划重操旧业回归评测博主身份
索泰展示全球最小RTX 5060 Ti 16GB主机 机箱容量仅2.65升
特斯拉车主纷纷安装DIY拉绳 避免事故时被全电动门围困
信用卡大撤退
RISC-V十五年 势不可挡
这五个人,看到了人类从未看到过的颜色
Google用一个Gemini撬起所有 1800元/月天价会员谁买?
返回上一页
首页
| cnbeta报时: 13:47:52
文字版
标准版
电脑端
© 2003-2025