才子佳人博客

我的故事我讲述

大数据洞察:不是因果关系,而是相关关系
 
来源:大数据时代  编辑:xjh  2015-12-02

知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。

亚马逊开始时聘请了一个由20多名书评家和编辑组成的团队,他们写书评、推荐新书,挑选非常有特色的新书标题放在亚马逊网站的主页面上。这个团队创立了“亚马逊的声音”这个版块,成为当时公司的一颗宝石,是其竞争优势的重要来源。正是因为他们的评论、推荐,使得书籍销量猛增。

后来,亚马逊决定,根据客户个人以前的购物喜好,为其推荐具体的书籍。这时,亚马逊已经储存了大量的数据。比如说,客户购买了什么书籍;他们只关注什么书;关注了多久却没有购买;等等。通过大数据的分析,为客户推荐新书。结果发现,通过这个计算机系统推荐的书的销量,比起专家团队推荐的书的销量,他们的差别是100倍。于是,他们解散了专家团队。亚马逊的这套计算机推荐系统只是梳理出了有趣的相关关系,但不知道背后的原因。知道“是什么”就足够了,没有必要知道“为什么”。

通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。如果A和B经常一起发生,我们只需要注意到如果B发生了,就可以预测A也发生了。

美国有一家折扣零售商叫“塔吉塔”(Target),他们使用大数据的相关关系分析已经有好多年了。对于零售商来说,知道一个顾客是否怀孕是非常重要的。因为这是一对夫妻改变消费观念的开始,也是一对夫妻生命的分水岭,他们会光顾以前不会去的商店,渐渐对新的品牌建立忠诚。Target的市场部向分析部求助,看是否有什么能够通过一个人的购物方式发现她是否怀孕。公司分析部的技术人员首先查看了签署婴儿礼物登记本的女性消费记录。他们注意到,登记本上的妇女会在怀孕大概第三个月的时候买很多无香乳液。几个月后,他们会买一些营养品。公司最终找到了大概20多种关联物,这些关联物可以给顾客的“怀孕趋势”评分。这些相关物甚至能够比较准确的预测预产期,这样就能够在孕期的每个阶段给客户寄送相应的优惠券,这才是Target市场部的目的。一天,一个男人冲进了Target商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”。几天后,经理向这个男人打电话致歉,这个男人的语气却变得平和起来,他说:“我跟我女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的人是我。”

UPS国际快递公司从2000年就开始使用预测性分析来监测自己全美60000辆车规模的车队,这样就能及时地进行防御性的修理。如果车在路上抛锚损失会非常大,因为那样就需要再派一辆车,会造成延误和再装载的负担,并耗费大量的人力物力。所以,以前UPS每两三年就会对车辆的零件进行定时更换。但这种方法不太有效,因为有的零件并没有什么毛病就被换掉了。通过监测车辆的各个部位,UPS如今只需要更换需要更换的零件,从而节省了好几百万美元。有一次,检测系统甚至帮助UPS公司发现了一辆新车的一个零件有问题,因此免除了可能会造成的困扰。


来源:
大数据时代,生活工作思维的大变革,浙江人民出版社,2013.1月第一版
http://blog.sina.com.cn/s/blog_a0ab739e01017dh6.html


分类:网络日志| 查看评论
相关文章
文章点击排行
本年度文章点击排行
发表评论:
  • 昵称: *
  • 邮箱: *
  • 网址:
  • 评论:(最多100字)
  • 验证码: