返回上一页
首页
| cnbeta报时: 21:33:16
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
查看网友评论
返回完整版观看
最新资讯
加载中...
埃普斯坦案受害者起诉特朗普政府与Google 指控其非法泄露个人信息并借助AI放大伤害
微软确认大幅改进 Windows 11 搜索功能
Asha Sharma上任后叫停“This Is an Xbox”宣传 称“这不像Xbox”
研究指“流浪行星”卫星或长久宜居 没有日光也可孕育生命
超小型“纳米激光器”问世有望重塑未来计算机芯片
人类下巴或只是“进化的副产物”
印度“脑死亡”女子被路坑颠活
涉嫌醉酒驾驶致事故 传奇高尔夫球星“老虎”伍兹被捕
NASA Artemis II任务进入最后准备阶段 4月1日前发射
张雪峰追悼会今日举行 民众自发起大早排长队送别
国际民航组织新规:乘客最多带2个充电宝 不得在飞行途中为充电宝充电
今日最热
加载中...
NeurIPS惹怒中国学术圈 这次踢到钢板了
“吴京水肿”登热搜:脸上一按一个坑惊呆网友
央视提醒:使用人脸识别时 千万穿好衣服
老头乐工厂向小米致歉:已撤回专利无效请求
被美列入黑名单的中国高校被曝采购含受限NVIDIA A100芯片的超微服务器
Google推出Gemini 3.1 Flash Live 实现实时AI交互
今年蚊子可能迎来史诗级加强:数量多、咬人狠、更难杀
万达电影拟更名为儒意电影
这群美国人赶在AI抢走工作前主动辞职 自主创业
Google将量子安全加密截止期限提前至2029年 远超政府时间表
苹果称启用“锁定模式”的设备迄今无一例遭间谍软件攻破
返回上一页
首页
| cnbeta报时: 21:33:16
文字版
标准版
电脑端
© 2003-2026