新闻来源:Gigaom.com
Netflix公司向客户推荐电影的算法可能并不完美,但他们总在尝试。Netflix公司高级数据科学家Mohammad Sabah在周三的Hadoop峰会上描述说,Netflix正在采集并分析惊人的数据来试验算出下一步你想要看什么电影。Sabah说,用户选择的电影已经有75%来自Netflix的推荐。

Netflix公司向客户推荐电影的算法可能并不完美,但他们总在尝试。Netflix公司高级数据科学家Mohammad Sabah在周三的Hadoop峰会上描述说,Netflix正在采集并分析惊人的数据来试验算出下一步你想要看什么电影。这是一项非常重要的工作, Sabah说, 用户选择的电影已经有75%来自Netflix的推荐 ,但Netflix想让这个比例更高。
Netflix公司正在收集的数据和其他信息有些什么呢?让我们来看看:
用户超过2500万;
每天大约3000万剧集(而且Netflix跟踪你的每次快退、快进及暂停动作);
仅在2011年最后三个月中,被观看的视频流就超过了20亿小时;
每天大约400万次用户打分;
每天大约300万搜索;
地理定位数据;
设备信息;
天数和周数(现在能证明,用户在工作日内观看更多的电视节目,而在周末观看更多的电影);
从第三方(如尼尔森公司)获得的元数据;
从Facebook和Twitter获得的社会媒体数据;
但,Netflix公司对数据最有趣的使用可能在于它竟然尝试去分析电影本身。Sabah说,Netflix采集了JPEG图片,并可以说明片头或片尾字幕开始滚动的具体时间,而且公司也正在注意考虑其它特征。这可能对考虑诸如音量、色彩和布景等因素有着很大的意义,而这些因素可以提供关于观众喜欢什么的重要信号。
来源:Gigaom.com 作者:Derrick Harris
编译:深圳达内IT培训中心,位于深圳市罗湖-福田区,提供各种计算机语言培训课程,包括C++、PHP、嵌入式、Java、软件测试、Android等。面向大专以上学生和已毕业的年轻人,学成之后推送就业入职深圳市本地的高新科技企业,帮助进入IT行业