返回上一页
首页
| cnbeta报时: 22:17:28
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
亚马逊宣布在荷兰投入14亿欧元大规模投资
研究人员将真菌转化为活体存储芯片
Intel CEO:与黄仁勋有30多年朋友交情 将创造全新产品类别
一加15发布:3999元起 首发165Hz高分高刷屏
全球首发165Hz高分高刷屏 一加15发布:3999元起
WPS格式被商务部采用 金山办公发布亮眼财报:净利润大增35%
特朗普化身士官长 白宫发AI图庆祝《光环》上PS
格力高管下场炮轰“群”,董明珠和雷军何仇何怨?
AMD突然发布锐龙10、锐龙100系列:Zen2、Zen3+身穿马甲又活了!
“这场战斗远未结束”:英特尔核心业务距扭转颓势仍遥遥无期
胡锡进谈“郑智化道歉”:名人需要谨慎使用自己的影响力
今日最热
加载中...
M5 MacBook Pro隐形升级:SSD速度提升211%
时隔五年印度与中国正式恢复直航 想拿签证要有100万存款
一场火,让公众对动力电池安全的信任“倒退十年”
全球近一半的拉链是一家公司生产的,拉链也有鄙视链?
瑞典知名演员伯恩·安德森去世 曾被誉为“世界第一美少年”
维修工程师痛批公版RTX 5090是史上最糟糕GPU设计
瞬间梦回90年代:爱好者让Wi-Fi数据重现拨号上网声音
在上海 有一个直径2.5公里的完美“圆形”
盲人脱口秀演员谈深圳机场被吐槽:人需要尊严
郑智化就“连滚带爬”一词道歉:小哥甚至搀扶我的腿进机门
揭秘Meta AI大裁员:Llama 4落后DeepSeek的恐慌
返回上一页
首页
| cnbeta报时: 22:17:28
文字版
标准版
电脑端
© 2003-2025