返回上一页
首页
| cnbeta报时: 11:40:07
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
查看网友评论
返回完整版观看
最新资讯
加载中...
WireGuard for Windows 1.0 正式版发布
小行星撞击或为地球生命“点火” 新研究拓展生命起源假说
陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
法院已阻止美国政府强制苹果下架ICE举报应用App Store
DESI完成最大宇宙三维地图观测
Q1存储价格暴涨:DDR与SSD翻番 PC厂商陷入抢货大战
蓝色起源准备重复使用新格伦助推器 以挑战SpaceX
AI 点燃新一轮“应用淘金热” App Store 重回高增长轨道
SE开发漫画排版AI工具 每年可节省3000小时
日本大叔诱拐女童强迫看漫画 看完之后还要考试
德国将与行业代表商讨航空燃油供应问题
今日最热
加载中...
韩国Naver宣布全面弃用阿里Qwen编码器
Claude Opus 4.7,为什么被全网吐槽?
陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
日本新干线高铁升级:支持5G车窗、降噪车厢
苹果iPhone 18/18e生产线已经开动
WireGuard for Windows 1.0 正式版发布
手机市场洗牌:华为苹果笑看涨价,小米跌出前五
美国人爱上麻将
几块钱一支的甲硝唑 真不是皮肤神药
日本大叔诱拐女童强迫看漫画 看完之后还要考试
南京车主能卖电赚钱 虚拟电厂规模堪比大型电厂
返回上一页
首页
| cnbeta报时: 11:40:07
文字版
标准版
电脑端
© 2003-2026