返回上一页
首页
| cnbeta报时: 07:16:00
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
3:0完胜越南创造历史 U23国足闯入亚洲杯决赛将对战日本
又一位联合创始人离开 杨格因病从马斯克AI公司离职
日本公布H3火箭发射失败原因:卫星和火箭结合部位破损
任天堂美国新女总裁亮相 勉励游戏开发者
安世半导体控制权争夺持续:荷兰法庭激辩 闻泰科技力证“资产掏空”等指控不实
OpenAI为ChatGPT个人版推出年龄识别功能
Windows 95有一个鲜为人知的重启技巧
三星得克萨斯州晶圆厂成AI热潮下科技大厂的“备胎之选”
Setapp移动版将于下月关闭 运营商称欧盟业务条款“复杂且仍在演变”
OSHA称SpaceX在星际基地起重机倒塌前没有进行适当的检查
地球出现特大地磁暴
今日最热
加载中...
特朗普公布马克龙的短信:“无法理解你在格陵兰岛问题上的所作所为”
西贝回应人民日报评论 还加了15个感叹号
日本学生利用Grok“脱衣”同班女生 可能面临刑事责任
王菲10年向嫣然天使捐款3268万 从设想到实施都是李亚鹏在做
连电话都不能打 超安静的高铁静音车厢到底怎么买
索尼官宣剥离电视业务与TCL合资 持股49%
梁小龙死因公开:因心脏衰竭离世
中国监管部门加大对拼多多的调查力度
98.43米!中国少年打破纸飞机飞行最远距离吉尼斯世界纪录
《人民日报》发文再评西贝事件:自媒体不是私域不可肆意
13岁儿子痴迷化学实验经常屋里点火 妈妈无奈报警
返回上一页
首页
| cnbeta报时: 07:16:00
文字版
标准版
电脑端
© 2003-2026