返回上一页
首页
| cnbeta报时: 11:39:29
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
甲亢哥欧洲行被问去过最好的国家:肯定是中国
抱冬瓜睡觉突然走红 医生提醒:此法并非人人皆宜
俞敏洪称中年危机很正常:建议重新设定一个人生目标
LPDDR6内存标准正式发布 冲击14.4GHz
NVIDIA凭什么值4万亿美元?每一步黄仁勋都选择对了
联想:PC单季度出货量同比增15.2% 市占率创历史新高
马斯克:Grok 在大多数方面已经比人类聪明得多
今村孝矢分享宫本茂的设计理念 游戏是“产品”并非“艺术品”
微软裁员再引争议 员工未归属股票被全部回收
《哪吒2》即将在北美全面发行 杨紫琼参与配音
比特币突破11.2万美元再创历史新高 科技热潮点燃冒险情绪
今日最热
加载中...
DeepSeek使用率暴跌至3%?
一男子被吸入客机发动机后死亡 现场目击者称人被瞬间汽化
多人收到河北文旅千条短信轰炸 手机流量被限速、占用几十GB存储空间
最懂打工人的蔬菜:给水就能活
称世界最大烟花出现在广岛和长崎 马斯克的大模型Grok让日本人破防
尖子生沉迷手机高考失常被扫地出门
罗马仕倒下,下一个会是安克吗?
全球最快高铁CR450AF和CR450BF内部亮相
三星Galaxy Z Fold7发布 该系列迄今为止最大的更新
游戏巨头Steam幕后:CEO隐居海上 六旬老人带79位员工赚尽全球玩家的钱
汪峰前女友葛荟婕自曝在腹部植入“戒酒芯片”直播间展示疤痕
返回上一页
首页
| cnbeta报时: 11:39:29
文字版
标准版
电脑端
© 2003-2025