返回上一页
首页
| cnbeta报时: 00:50:15
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
查看网友评论
返回完整版观看
最新资讯
加载中...
美国与伊朗在瑞士开始就永久和平协议进行谈判
欧洲持续热浪,气温逼近40摄氏度
《GTA6》预购价格可能泄露 最贵版本达200欧元
创作者拟借助冷门法律从EA手中夺回《创世纪》系列
传闻:EA已开始向员工通知裁员 多个部门将受波及
索尼或考虑推迟PS6发售 原定2027年上市
微博CEO吐槽WPS 强占C盘云备份失效费用还天天涨
全身仅剩眼球能动 蔡磊真人出镜发布《倒计时》演讲 用AI复原声音
磷酸铁锂价格一年翻倍至2.5万元/400公斤 车企狂抢订单
雷军回应“早餐摆拍被吐槽”:大家看到这些报道,笑一笑就好
空客发布U145全自主货运直升机 将座舱位置改装为货舱
今日最热
加载中...
苹果相册“人工智障”式取名登热搜
五个CEO在讲台上,没人敢说“会好起来”
Windows 11 26H2延续了微软向“小步快跑”更新模式的转变
一句话,GPT-5.6 Pro用48分钟造出完整《模拟人生》
骁龙8 Elite Gen 6标准版封装尺寸与前代相同 2nm工艺推动成本大幅上升
微博CEO吐槽WPS 强占C盘云备份失效费用还天天涨
GPT-5.6或将下周问世:从“模型”迈向“可执行Agent” 定价或仅为竞品1/3
年轻人最爱的“平价聚会活动”也被AI入侵 遭殃的人一大把
英伟达员工抛弃“金手铐”:为何我放弃数百万美元股票也要离职
三天内连失两位传奇:谷歌的AI人才大坝正在决堤?
雷军回应“早餐摆拍被吐槽”:大家看到这些报道,笑一笑就好
返回上一页
首页
| cnbeta报时: 00:50:15
文字版
标准版
电脑端
© 2003-2026