谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 21:26:39

谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言

发布日期:2013-03-10 11:16:23 稿源：

据外媒报道，谷歌于近日发布了一个大型数据集合--Wikilinks Corpus，它将可以帮助开发人员构建出可以准确解释人类语言的软件。Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接，它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容，进而确定一些模棱两可单词的意思。

谷歌在其Reaserch Blog中提出，人类非常擅长辨别同一个单词在不同语境下的意思。比如说，当把dodge写成Dodge时，它就是一个车子的品牌，而当写成to dodge的时候，它就是一个动词。

跟谷歌搜索算法非常类似，Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的，并且它的规模要比以往的数据集合都要来得大。更重要的是，它是免费的。虽然由于版权问题，谷歌无法发布个人网页的实际内容，但是它却可以提供获得这些内容的代码。

查看网友评论返回完整版观看

最新资讯

加载中...

AI硬件投资热潮重创IBM 昨日该股暴跌25%创历史纪录

巴菲特：比尔盖茨与爱泼斯坦往来 “令人反感” 但人孰能无过

热浪席卷欧洲民众轻信社交媒体“冰箱降温法”导致大量手机因受潮损坏送修

美国财政部首次制裁VPN服务提供商及其管理人员重拳打击勒索软件幕后帮凶

微软修复潜伏十余年的安全启动绕过漏洞旧组件成最大隐患

NASA携手37家美国企业共同推进月球与火星探索前沿技术研发

NASA斥资近6亿美元推进月球基地建设选定三家商业公司执行全新登月任务

“毅力号”火星车完成马拉松里程碑 NASA火星勘测轨道飞行器捕捉到完整轨迹

FreeBSD笔记本支持持续改进 Wi-Fi、GPU与音频驱动迎来显著进展

Linus Torvalds重申：Linux并非“反AI”项目也不做“社会斗士”

亚马逊Leo卫星网络携手南非最大ISP挺进非洲领先SpaceX星链

今日最热

加载中...

IBM或将创下史上单日最大跌幅

美国会众议院通过永久实行夏令时法案

AI算力需求吸走客户 IBM市值蒸发4600亿：CEO公开信说了什么？

AMD Zen 6架构首秀 256核EPYC处理器助力AI性能大幅跃升

传苹果iPhone 20将迎来全玻璃机身设计供应链已做好准备

FreeBSD 16已完成移除基础系统中残留的全部GPL代码

纽约州宣布暂停建设所有新建数据中心

美方确认NVIDIA H200芯片已启动对华出口涉及多家中国头部AI企业

ChatGPT Mac版被指擅自读取本地文件引发隐私担忧

伊朗利用移动网络漏洞追踪中东地区美军动向

三星公布Flex Titanium技术针对新一代折叠屏手机的关键创新

返回上一页首页 | cnbeta报时: 21:26:39

文字版标准版电脑端

© 2003-2026