返回上一页
首页
| cnbeta报时: 18:47:20
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
查看网友评论
返回完整版观看
最新资讯
加载中...
两名外国车花3万从海南打车到哈尔滨 网约车司机开心到起飞
UU跑腿回应999元代磕头业务下线:正在优化调整 后续或重新上线
胎死腹中的RTX 3080 Ti 20GB首测:显存更大 但只有3080的水平
抢票为什么一定要用12306候补?官方明确:候补人多了 铁路可能会加开列车
2019-2025汽油车销量缩水超千万辆 新能源成车市主力
电费警报!Intel下代Nova Lake桌面CPU功耗超700W
《波斯王子:时之砂》重制版资源泄露 但无法游玩
妥协了!《守望先锋》官方将重新设计新角色安燃形象
OpenAI携ChatGPT“入主”美国防部AI平台
ChatGPT 4o大模型备受欢迎 OpenAI为何要淘汰它?
腾讯张军发文庆祝QQ上线27周年:轻舞飞扬已经不见,QQ还在
今日最热
加载中...
才买3年672辆纯电公交因续航衰减停运 东莞最大公交公司起诉卖家 法院判了
Linux 7.0将为Rust“试验期”画上句号
Prada不锈钢勺子售价1200元引热议 有人已买并给五星好评
这份职业成了人工智能不会取代人类的终极案例
网友曝光上海迪士尼新头车 别克至境世家接棒
古天乐自曝有轻度失忆 会完全忘记演过某部戏
AirPods Pro 4 或配备红外摄像头 可实现“环绕视觉”
内存价格依然狂飙:本季再涨90% 64GB容量将突破7000元
“不要对AI说谢谢”疯传 实测多个大模型都表示问题不大
索尼新一代旗舰真无线耳机WF-1000XM6规格泄露 降噪性能与处理器大升级
LibreOffice再批微软“将商业利益置于一切之上”
返回上一页
首页
| cnbeta报时: 18:47:20
文字版
标准版
电脑端
© 2003-2026