机器学习为许多深受欢迎的Google应用程序增添了不少魅力,当前有超过百支谷歌团队在使用这项技术,包括街景、收件箱智能回复、语音搜索等。在I/O 2016大会的主题演讲期间,Google向大家介绍了其在人工智能和机器学习领域的最新进展,其中一个有趣的细节,就是所谓的TPU(张量处理单元)定制芯片。为了帮助大家更好地理解,Google著名硬件工程师Norm Jouppi特地在云平台博客上发表了一篇深入介绍TPU的文章。
一块TPU的板子,刚好可以插入数据中心机架的一个驱动器位。
优秀的软件,自然少不了优秀硬件的加持。几年前,Google就已经悄悄地开展了一个项目——自己动手,为机器学习应用程序提供定制加速。
这项研究的成果,就是本文要着重介绍的“张量处理单元”(Tensor Processing Unit),简称TPU。这是一款为机器学习而定制的ASIC、并且经过了TensorFlow的调教。
TPU已经在Google数据中心运行了一年多,实践表明它可以为机器学习带来相当出色的每瓦特性能表现。TPU是专为机器学习应用而定制的,它的宽容度更高,可以降低计算的精度(所需的晶体管操作也更少)。
正因如此,我们每秒都可以在芯片中挤出更多的操作时间,使用更复杂和强大的机器学习模型、将之更快的部署,用户也会更加迅速地获得更智能的结果。
TPU在AlphaGo与李世石的“世纪之战”中得到了实际应用。
TPU是Google从研究快速走向实际应用的一个积极例子,团队只花了22天的时间,就让它在数据中心运行了起来。
TPU早已为许多Google服务提供支撑,包括RankBrain(用于改进搜索结果的相关性)和街景(改进地图导航的精度和品质)。
在与李世石的人机围棋对战中,AlphaGo的背后也有着TPU的身影。TPU让AlphaGo可以更快的思考,在移动之前更加高瞻远瞩。
Google的目标是在机器学习领域做到业内领先,同时将创新提供给尽可能多的客户。
在基础设施对战中打造的TPU,使得Google能够向开发者们带去更大的软件能量,比如在先进的加速技术加持下的TensorFlow和云机器学习。
机器学习已经改变了开发者们为消费者打造智能应用程序的方法,我们热切期待着它能够走入我们的日常生活中。
[编译自:Google Blog]