
该技术在Facebook、eBay和Netflix等大公司中获得迅速发展,被用于分析海量数据,但对雅虎在财务上没有多大贡献。雅虎是在2005年投资开发了Hadoop的早期原型,一年后将其用于数据中心的分析。
如今,Hadoop负责雅虎在线广告系统的定价和预测,过滤垃圾邮件以及个性化雅虎主页。以下数字更好地理解其处理数据的规模。雅虎有42000台服务器供Hadoop运行,服务器每4天存储的数据相当于整个美国国会图书馆的信息量。
雅虎云平台组高级副总裁杰·罗斯特(Jay Rossiter)在介绍Hadoop时,将其称为“基本上是雅虎运行的引擎”。雅虎和Benchmark Capital拒绝透露在Hortonworks上的投资和持股情况。
Hortonworks公司将有约25名职员,其中大多来自雅虎,其中前雅虎软件工程副总裁埃里克·巴尔德施维勒(Eric Baldeschwieler),将担任该公司CEO。
文/网易科技