返回上一页  首页 | cnbeta报时: 01:29:09
[视频]谷歌DeepMind AI已经掌握超难雅达利游戏
发布日期:2016-06-10 13:40:29  稿源:cnBeta.COM

与李世石一战成名后,AlphaGo背后的谷歌DeepMind人工智能团队越来越受到业界关注。DeepMind团队的领导人Demis Hassabis与游戏界的渊源由来已久,在AlphaGo成名之前DeepMind团队最初用来测试AI的都是雅达利的老游戏。

最早DeepMind的老版本AI在超难的游戏《Montezuma’s revenge》中表现欠佳,但是在经过长时间的学习和试错后,DeepMind团队新版本的AI真正地掌握了游戏大师级技巧。其学习过程并无采取任何捷径,没有被提供额外的信息。真正地模仿人类学习过程,DeepMind的人工智能已经学会了躲避技巧,拾取钥匙,像专家一样努力争取最高分。

DeepMind在新版本的AI中加入了一种名为“好奇心”的内部激励机制,游戏AI能够更趋向于获得更高分,并积极探索更多不同的游戏方法获得更好的回报。这项机制能够允许新版本 的AI更加积极地去探索游戏要素,掌握游戏方法。

从以下对比可以看出来,老版本AI仅探索了2间游戏房屋,新版本AI则由新机制驱动探索了共15间游戏房屋。

http://static.cnbetacdn.com/article/2016/0610/505a34481d193d4.png

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 01:29:09

文字版  标准版  电脑端

© 2003-2024