谈到大数据,一定会提到三个经典案例: 第一个经典的例子是预测女孩怀孕“大数据”,2012年2月16日《纽约时报》刊登了一篇题为《这些公司是如何知道您的秘密的》报道。文中介绍了这样一个故事:一天一位男性顾客怒气冲冲地来到一家折扣连锁店“塔吉特”这是一家仅次于沃尔玛的全美第二大零售商向经理投诉因为该店竟然给他还在读高中的的女儿邮寄婴儿服装和孕妇服装的优惠券。但随后这位父亲与女儿进一步沟通发现自己女儿真的已经怀孕了。于是致电塔吉特道歉说他误解商店了女儿的预产期确实是8月份。这里用到的就是大数据“关联规则+预测推荐”技术。 第二个是经典的“啤酒和尿布”的例子,这个例子比较早,讲的是基于关联规则分析来预测超市里面顾客购买行为规律。20世纪90年代美国沃尔玛超市中,超市管理人员分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲去超市买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而去另一家可以一次同时买到啤酒与尿布的商店。由此,沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物,从而获得了很好的商品销售收入。 第三个案例是近年来才炒得比较火热的例子“谷歌预测流感”,是谷歌通过搜索引擎里面的关键词检索日志的时间序列数据成功预测了流感爆发的时间和规模。人们输入的搜索关键词代表了他们的即时需要,反映出用户情况。为便于建立关联,设计人员编入“一揽子”流感关键词,包括温度计、流感症状、肌肉疼痛、胸闷等。只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图。为验证“谷歌流感趋势”预警系统的正确性,谷歌多次把测试结果与美国疾病控制和预防中心的报告做比对,证实两者结论存在很大相关性。 第一个例子背后是基于精准营销,是大数据针对个人级别的应用,第二个例子能够有效预测零售商需求,属于企业级别应用,而第三个例子则是地区级别和国家级别的应用。由此可看出,当大数据真正走进生活、走进社会,其施展能量的力度越来越大,越来越强。所以国家、教育部和企业越来越重视大数据和人工智能的开发和应用,
|