返回上一页
首页
| cnbeta报时: 14:39:40
谷歌发布大型数据集合Wikilinks 可让程序更好地理解人类语言
发布日期:2013-03-10 11:16:23
稿源:
据外媒报道,谷歌于近日发布了一个大型数据集合--Wikilinks Corpus,它将可以帮助开发人员构建出可以准确解释人类语言的软件。
Wikilinks Corpus中包含了来自各大网页及维基百科文章的4000多万条个人链接,它们则被称为mention。开发人员则可以通过分析每一条mention的内容以及目标文章的内容,进而确定一些模棱两可单词的意思。
谷歌在其Reaserch Blog中提出,人类非常擅长辨别同一个单词在不同语境下的意思。比如说,当把dodge写成Dodge时,它就是一个车子的品牌,而当写成to dodge的时候,它就是一个动词。
跟谷歌搜索算法非常类似,Wikilinks Corpus也是由在来自马萨诸塞大学阿默斯特分校的研究人员的协助下完成的,并且它的规模要比以往的数据集合都要来得大。更重要的是,它是免费的。虽然由于版权问题,谷歌无法发布个人网页的实际内容,但是它却可以提供获得这些内容的代码。
我们在
FebBox
(
https://www.febbox.com/cnbeta
) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论
返回完整版观看
最新资讯
加载中...
OpenAI推出ChatGPT应用目录 向“一站式超级应用”迈进
实验发现源自大麻的化合物或可抑制卵巢癌细胞的生长和扩散
环保新材料攻克PFAS 科学家实现在水中快速捕获并分解污染物
iOS 26.3首个公测版发布:苹果、安卓正式互通 可互传数据
日版App Store大改 引入第三方应用商店与支付选项
工信部部长会见AMD CEO苏姿丰:希望继续深耕中国市场
三星Exynos 2600确认10核心、3.9GHz超大核 全球首款2nm手机芯片
豪威单芯片LCOS小尺寸面板发布 采用3微米像素
苹果已启动24英寸iMac OLED面板的研发工作
Intel更高端独显临近 BMG-G31再添官方证据
Titan Ada巨卡原型现身:48GB显存、四插槽、900W供电
今日最热
加载中...
比尔盖茨小女儿公开恋情 男友撞脸扎克伯格
网传高圆圆综艺用替身 品牌方澄清:是光替 也非综艺
京东自提全国正式上线:即提即走 再减1元
魏建军称一体压铸技术维修性很差 长城不用 理想材料技术负责人回应
“一体式压铸”维修性差?理想汽车负责人回应
不丹承诺以1万枚比特币支持“正念之城”建设
罗永浩回顾新东方工作经历:我骂老板被说成忘恩负义,太奇怪了
余承东“路上睡觉”的梦想,快要实现了
模型免费、推理翻倍:Gemini 3 Flash发放智能体时代的“入场券”
96Gbps带宽成就500Hz超高刷游戏 HDMI 2.2 Ultra96数据线即将首秀
IGN记者吐槽《古墓丽影》劳拉新造型:谁会戴假睫毛冒险?
返回上一页
首页
| cnbeta报时: 14:39:40
文字版
标准版
电脑端
© 2003-2025