才子佳人博客

我的故事我讲述

大数据时代,FareCast机票价格预测系统
 
来源:大数据时代  编辑:xjh  2015-12-02

2003年,奥伦·埃齐奥尼(Oren Etzioni)准备乘坐从西雅图到洛杉矶的飞机去参加弟弟的婚礼。在他的意识里,飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个月,就在网上预订了一张去洛杉矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。

对大多数人来说,这种被敲竹杠的感觉也许会随着他们走下飞机而消失。然而,埃齐奥尼是美国最有名的计算机专家之一。飞机着陆之后,埃齐奥尼下定决心要帮助人们开发一个系统,用来推测当前网页上的机票价格是否合理。作为一种商品,同一架飞机上每个座位的价格本来不应该有差别,但实际上,价格却千差万别,其中缘由只有航空公司自己清楚。

埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是预测当前的机票价格在未来一段时间内会上涨还是下降。

如果一张机票的平均价格呈下降趋势,系统就会帮助用户做出稍后再购票的明智选择。反过来,如果一张机票的平均价格呈上涨趋势,系统就会提醒用户立刻购买该机票。

系统的运转需要海量数据的支持。为了提高预测的准确性,埃齐奥尼找到了一个行业机票预订数据库。如今,这个名叫Farecast的系统已经拥有惊人的约10万亿条飞行数据记录。预测准确度为75%,使用该系统的旅客,平均每张机票可节省50美元。

2008年,埃齐奥尼计划将这项技术应用到其他领域,比如宾馆预订、二手车购买等。只要这些领域的产品差异不大,同时存在大幅度的价格差和大量可运用的数据,就都可以应用这项技术。但在他实现计划之前,微软公司找上了他并以1.1亿美元的价格收购了FareCast公司。

人们不再认为数据是静止和陈旧的。但是在以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了。比方说,在飞机起飞之后,票价数据就没有用了(对谷歌而言,一个检索命令完成之后)。

来源:
大数据时代,生活工作思维的大变革,浙江人民出版社,2013.1月第一版,p4-7
http://blog.sina.com.cn/s/blog_a0ab739e01017d4s.html


分类:网络日志| 查看评论
相关文章
文章点击排行
本年度文章点击排行
发表评论:
  • 昵称: *
  • 邮箱: *
  • 网址:
  • 评论:(最多100字)
  • 验证码: