返回上一页
首页
| cnbeta报时: 04:40:55
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
Mozilla Firefox 143 正式版发布
Meta提前泄露新款带显示屏的智能眼镜
移民局突袭佐治亚州现代汽车工厂事件后 特朗普称欢迎外国劳工
特朗普建议上市企业将季报改为半年报
微软Office应用现已免费提供Copilot Chat功能
苹果发布macOS 26 带来Liquid Glass和新的连续互通功能
苹果发布包含全新液态玻璃设计的iOS 26和iPadOS 26
OpenAI发布基于GPT-5的升级版Codex AI编程助手
与苹果iOS26液态玻璃设计完美适配的3款必装App
微软提醒Office 2016/2019用户:支持服务即将终止 建议迁移至云端
纽约州拟要求TikTok、YouTube及Instagram上线年龄验证机制
今日最热
加载中...
卫星图像显示缅甸诈骗园区规模不减反增 多达10万人被贩运
罗永浩:集体诉讼会公开报名渠道 贾国龙道歉也来不及了
官方证实:秦始皇“昆仑神山”石刻是真的
女子散步时踩到氢氟酸后不幸去世
MacBook遇诡异“Bug”一直异响 原因令人哭笑不得
罗永浩:华与华老板已跟我道歉 这件事可以过去了
多名博主爆料高速公路限速有变:最高能跑140km/h
日本学生设计“智能内衣”:仅单一伴侣指纹能解锁
美国人自己的4399,居然把Steam给吊起来锤了?
西贝致歉:10月1日前全国门店会陆续完成9大调整
GPT-5惨遭零分打脸 顶级AI全军覆没 奥特曼AI博士级能力神话破灭
返回上一页
首页
| cnbeta报时: 04:40:55
文字版
标准版
电脑端
© 2003-2025