2011年11月25日,星期五。 nba劳资双方达成协议的同一天,在没有任何提前宣传的情况下,已经荒废许久的百视达线上业务重新开启了。 尽管还使用百视达的域名依托百视达的名号,新的百视达网站却跟以往完全不同了,甚至可以说跟原百视达的关系只剩下一个名字。 新百视达提供三种业务并不包括原来的dvd租售业务,取而代之的是在线流媒体播放、视频分享和在线直播。 在线流媒体播放业务瞄准的对手是奈飞,只要每个月支付399镁元就可以在新百视达的网站上随意观看超过两万部电影。 当然,铧国有一句老话叫做“一分钱一分货”,这话放之四海而皆准,放在镁国也一样准。 新百视达的月租费用便宜,主要原因是片库太烂了,内容大多是百视达之前购买下来的各种老电影版权,这些电影主要集中在七八十年代,九十年代的电影只占20左右,新世纪的电影更是只有10,至于各种最新的好莱坞大片,抱歉,一个都没有! 视频分享业务瞄准的对手是油管。 二零零六年谷歌斥资165亿镁元收购了创立仅仅一年多的油管,当时被很多人认为是疯了。 结果光是去年,油管就为谷歌带来了超过十五亿镁元的净收入,可以说谷歌当初做了一笔特别合算的生意。 二零一一年的油管已经成长为全球最大的视频网站,拥有超过七亿用户,全世界用户每天都在油管上花费几亿小时。 想要分油管一杯羹的视频网站不计其数,百视达只是其中的一个罢了。 在线直播的直接竞争对手是itch,这是一个今年六月份才刚刚创立的电子竞技视频平台,视频游戏玩家可以在平台上实时地观看其它玩家的游戏情况。 李睿把九间房的那一套直播方案复刻到了新百视达网站上,不但有游戏玩家的实时直播,还另外开辟了美女频道,游戏和美女这两个年轻男人最喜欢的要素齐聚,就不信吸引不来用户。 随着百视达网站上线的,还有张铭开发的协同过滤算法, 这种算法可以将用户进行分组并有针对性的推荐电影,其实就是前世铧文热点个性化分发和智能推荐的雏形。 表面上看起来,李睿这是在丰富百视达的推荐系统,实际上是为了帮助张铭尽快完成算法研究。 为了积累足够的数据,新百视达不但使用了百视达之前的所有dvd电影租售数据,还推出了一个电影评分系统。 根据正面或者负面评价的重合度来给用户进行聚类,进而通过用户喜欢的电影来进行推荐。 为了让这套系统发挥作用,李睿和张铭采取了游戏化设计,用户收藏、观赏、评价电影之后都会获得各种不同的成就奖励,当用户浏览新百视达网站的时候,系统会利用各种方式吸引或者是诱惑他们给电影评分,只要有足够多的用户提供更多的评价,就能为数据库提供最准确的数据支持,构建一个可以预测用户电影偏好的协同过滤流程,在权衡众多关键因素后向用户推荐电影。 目前这个算法还比较稚嫩,未来需要经过不断的进化。 为了让这个进化的过程加快一点,李睿推出了重金悬赏。 百视达大奖! 这是一个面向机器学习和数据挖掘的奖项,旨在提升协同过滤算法的预测能力,凡是能够将算法准确率提升10的团队,将会获得百视达颁发的一百万镁元奖金! 具体量化指标为rse--预测的评分与真实评分相差的均方根(root an sared error),张铭的算法目前的rse得分是09525,谁能将这个得分降低到08572或更低,就能拿到一百万! 李睿确实没有为新百视达的上线做任何宣传,但他在推特、脸书、reddit和其他各种网络媒体上同时发布了百视达大奖的消息,立刻引发了全世界科学家、数学家和算法研究者的关注。 …… 新泽西,弗伦翰公园,这里距离曼哈顿有九十分钟的火车车程,看不到大城市的繁华和华尔街的行色匆匆,有的只是一大片绿色的原野和郁郁葱葱的大树。 镁国电话电报公司香农实验室就座落在这里,一大片简洁的建筑之中,到处摆满了早期的电话机和各种已经可以称之为古董的电子设备。 克里斯·沃林斯基是实验室的执行董事,他正坐在二层的休息室里摆弄着手机,以便放松一下被各种数据占据的大脑,刚刚刷新出来的reddit页面上,忽然蹦出了一个吸引眼球的标题。 【想拿百万镁元大奖吗?百视达大奖等待着你!】 百万镁元? 百视达? 这两个词语都深深吸引到了沃林斯基的注意力,立刻点击那个帖子。 看完内容之后,他又马上登陆百视达网站,果然发现这个被认为已经死去的网站不知什么时候复活了,干净整洁的页面,井井有条的排列,以及三大新业务板块都在昭告世人:那个曾经统治着全镁国家庭电视机的巨头又回来了! 在沃林斯基年轻的时候,曾经也是百视达忠实的用户,当然他早已经抛弃老旧的百视达转投奈飞的怀抱,但看到百视达起死回生还是有些激动。 更何况他对百视达提供的百万镁元大奖很感兴趣。 要知道,他的实验室里就有一个数据挖掘小组,多年来一直都在预测客户的潜在行为。 数据挖掘其实也是一种算法,是在庞大数据集中寻找预测性或关键性模式的过程。 比如通过对谷歌页面的几千万次检索,判断哪些客户更有可能购买苹果手机? 或者是通过对于信用卡消费情况的数据分析,判断什么样行为的客户更容易成为欺诈犯? 再或者对某个破产群体的数据分析之后,研究类似人群最有可能面对的风险是什么? 沃林斯基觉得,百视达这个大奖就是为他的数据挖掘小组量身定做的,他立刻用手机给小组的二十几个成员群发了短信,把大奖链接和内容告诉了他们。 很快,一条条回复如同雪片似的返回。 “来吧,让我们一起争夺百万大奖吧!”一个叫做贝尔的员工这样说着。 与此同时,在镁国,在欧洲,在铧国,在全世界很多地方,许多天资聪颖的人也都发出了这样的声音。 区区百万镁元,李睿就让这些全球最聪明的脑袋集合到一起,为完善张铭的算法开始努力奋斗了。