|
大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。作为继云计算,IT产业的又一次新技术、颠覆性革命,无论是芝麻开门般的财富奇迹,还是对人们生活的影响。大数据不断地被提及,更是成为了影响当今世界创新的重要知识点。
什么是大数据?
曾在《大数据时代》一书中提到,以前人们使用的大多是抽样数据,而大数据则包含了所有数据。另外,大数据关注效率,而不是精准度,关注关联性,而不是因果关系。以前的大多数数据被称为结构化数据,比如“你几岁?我15岁”,而“我今天说了什么话?我今天吃了什么东西?”这些数据则被称为非结构化数据,主要指一些描述性的数据。随着互联网的发展,这些非结构化数据被收集并存放起来,对于这些数据加以分析利用,便构成了大数据的应用,这也是大数据不同于之前数据的最为重要的一点。
大数据到底有多大?
大数据所涉及的数据量非常大,而且正变得越来越大。自人类有文字记载到2012年为止,古今中外所有人类出版的资料,共计数据200PB。而在互联网发展的短短十几年里,数据量就已经步入了EB、ZB时代。以1号店为例,1号店一年产生的数据约为20个PB。这20个PB只是有过数据储存的这部分,不是1号店产生的全部数据。这些数据相当于有人类文字记载到2012年止所有数据的十分之一,而且,这只是1号店一家公司所产生的数据量。数据量正以惊人的速度爆炸并发展,是随着互联网的应用而产生的爆发式增长。
备注:单位从小到大排序:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 进率1024
1Byte = 8 Bit
1KB = 1,024 Bytes
1MB = 1,024 B = 1,048,576 Bytes
1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes
1TB=2的40次方Byte=1099511627776 Byte
1PB=2的50次方Byte=1125899906842624Byte
1EB=2的60次方Byte= 1152921504606846976 Byte
1ZB=2的70次方Byte= 1180591620717411303424 Byte
1YB=2的80次方Byte= 1208925819614629174706176 Byte
1DB=2的90次方Byte= 1237940039285380274899124224 Byte
1NB=2的100次方Byte= 1267650600228229401496703205376 Byte
这么多数据从哪儿来?
以一位浏览了1号店网页的顾客为例,他从哪里来?在1号店网站浏览了哪些页面?看过哪些商品?涉及的品类有多少?是否使用了搜索功能?还是只是随便浏览?这些看似不经意的数据都会储存在1号店的大数据平台。为什么数据越来越多?就是因为人们无时无刻不产生数据。比如上海科普大讲坛邀请1号店CTO韩军在1点45分进行了关于大数据的演讲,这个时间点便产生了一些数据。还有大家无时无刻不使用的移动设备,也会不断产生数据。每个人都在不断地产生各式各样的数据,这就使得数据越来越多,无所不在。
大数据是如何应用的?
以一个怀孕的女性为例,她的消费行为可能会在怀孕的前四周或者前五周突然发生变化,比如在她网购时,原来喜欢买甜食,现在则偏好酸的食物,这些信息就会被 纳入企业数据库,并被记录下来。随后,公司会为这位孕妇推送与怀孕相关的产品优惠券,这就是典型的大数据应用。亚马逊有一个非常神奇的大数据应用,叫做 “未购买先发货”。亚马逊作为全球最大的电子商务网站,对于大数据有着许多应用。比如,亚马逊会根据消费者在网站上的消费行为,预测顾客下个礼拜的需求, 如牙膏、薯片、大米、酱油等。亚马逊会自动生成订单,将这些商品送到顾客家中。顾客作为消费者主体,在根本没有意识到自己需要这些东西的时候,商品就已经 送到手中。以实际应用效果来看,绝大多数消费者认为“未购买先发货”的预测较为准确,会愉快地签收订单。
大数据下的个人隐私?
现代人使用智能手机时,商家会将信息存在云端备份,这些数据的存在,不可避免地会引发隐私问题。美国曾有预测学家说过,在未来十年或二十年,现在人们认为 非常重要的隐私,会慢慢转变为每个人都乐于将数据共享,这也将成为社会发展的一个过程。大数据下的信息处理,可以将人们在图书馆借书的信息和网上购物的信 息产生交集,比如在人们在图书馆借阅了健康类书籍后,在网上买披萨时,会为顾客推荐更健康的披萨。当数据产生关联后,也就产生了价值。在大数据下,隐私与 便利永远存在矛盾,可谓没有绝对的隐私。在这个数据化生存的时代,数据跟隐私是相对的。隐私和便利之间,也在慢慢寻求平衡。
电商对于大数据有着怎样的应用?
对电商来说卖什么产品?以什么价格销售?如何防止价格设置出错?应该卖什么商品?什么商品好卖?什么商品不好卖?都需要运用大数据。定价对于电商领域的竞争而言非常重要。比如,在大数据的应用下,1号店设计了名为“智能价格”的应用。每天会自动在网站上搜索大量的产品价格,然后根据搜取的价格信息,对价格进行自动调整,以保证1号店的产品价格处于可竞争性的地位。在各大电商齐打价格战的“双十一”,1号 店的价格系统对于部分热销商品,每隔一两分钟就会对其他电商的商品价格进行扫描比对,实时推动价格变动。在电商的运营中,销量、价格和库存有着密不可分的 关系,库存又和备货有着重要关系,这些都需要非常强大的销售预测系统进行支撑。还有许多诸如此类的大数据应用不胜枚举,大数据的应用对于电商打价格战,提 高毛利,更好地服务消费者都有着巨大帮助。
|
|