搜索
查看: 3233|: 0

大数据时代 得“数据”者得天下

[复制链接]

202

主题

6

回帖

885

积分

高级会员

积分
885
发表于 2014-9-13 11:14:26 | 显示全部楼层 |阅读模式

15年前,人们认为互联网存在“泡沫”,但事实证明其并没有被高估;5年以前,人们又都认为电子商务被夸大,但如今看来这也是错误的结论。今天,大数据已经越来越多地影响和左右人们的生活,引发社会变革和创新革命,它也必将引领一个崭新的时代。

数据正在每天为你做着网络生活笔记:你喜欢什么?看到了什么?做出了怎样的反应?你的性格喜好?心情如何?……生活中,我们在每一时刻,每个行为都产生着数据。我们的网络浏览痕迹、电商购物喜好、社交网络习惯等网络“足迹”都以数据的形式存储了下来。它们精准及时、事无巨细。而借助于对这些数据的研究和分析,就可以拼出一个比你更了解自己的“你”。

这样由一个个数据构筑的世界,引领我们进入大数据时代。

大数据被认为是人类文明第三次浪潮的主角,将改变人类的思考模式、生活习惯和商业法则,被认为将引发社会发展的深刻变革,被美国定位为未来最重要的国家战略之一,是未来大国博弈的决胜关键……

商人们很快将它变为真金白银的生意。Amazon和Facebook用它卖出了更多的广告;Netflix用它创造了《纸牌屋》的收视奇迹;ZARA用它实现了比LV还高的利润率;奥巴马用它赢得了总统选举,但又为因它而起的“棱镜门”事件而焦头烂额……

然而,世界对于“大数据所带来的机遇是否被过分炒作”的质疑从未停歇。有关“大数据还是大忽悠”的辩论也异常激烈。

“在15年前,人们认为互联网存在泡沫,但事实证明其并没有被高估;5年以前,人们又都认为电子商务被夸大,但如今看来这也是错误的结论。新事物的发展需要泡沫,这样才能吸引更多的资金和人才,沉淀下来的才是真正宝贵的东西。”国内一流的大数据解决方案提供商AdMaster(精硕科技)创始人兼CTO洪倍接受《时代人物》记者采访时说。洪倍称得上是大数据技术方面的权威,在他的带领下,AdMaster技术团队独创了AdMaster Dual-Cookie 技术,获得了国家软件著作权证书以及上海市高新技术成果转化奖。

数据“大爆炸”

你可能并不一定知晓下面这些数字,但你也一定会感受到“数据”正在呈几何基数的爆炸性增长,因为10亿台电脑、40亿部手机、无数的互联网终端……正在使得我们生活的世界高速数字化,“信息爆炸”早已从抽象的概念变为现实的描述。

从出现文字记录到2003年,人类总共创造出的数据量只相当于现在全世界两天创造出的数据量;在如此大的基数之上,全球的数据量仍然每18个月就会翻一番;预计到2020年,全球数据规模会达到今天的44倍;如今人们在一天之内上传的照片数量就相当于柯达发明胶卷之后拍摄的所有图像的总和……

就在10年前,1.44M的3.5寸盘还是我们装机的必备;几年前,体积不大但容量数百M的移动存储还曾让人们兴奋不已;而现在,GB级别的小U盘和TB级别的移动硬盘早已是普通用户的寻常之物。

数据分析并不是一个新概念,也有人会因此对于大数据不以为然,认为这只不过是新瓶老酒而已。但是,量变引发质变传统数据所采用的获取、存储、分析和解释的方法和技术,早已无法应对现在的数据规模、产生速度和复杂程度了。

“大数据发展有一个最大的特点,就是它会自己促进自己,数据量越大,你越想去算,算完了你就会想采集更多的数据,来验证你的想法,周而复始数据量又会上去,它就是一个正循环。”数据的规模越大,就令洪倍越兴奋。2006年,洪倍和闫曌共同创建AdMaster,主要专注于广告监测技术的探索、数字广告投资回报率的整体研究和监测数据的分析挖掘。“从公司刚创立一直到今天,随着生意规模的上升,数据量也随之上升。数据规模大了之后,存储或者清洗、挖掘都有着较高的技术要求,那时我已经意识到这是一个大数据问题了。”

“数据的获取和挖掘都已找到解决方法了,AdMaster拥有了庞大的数据量。AdMaster每天从互联网上获取的数据都是以T计算的。那么怎么“玩”这些数据呢?只有把庞大的数,变成有用的据,才能被称为“大数据”。洪倍一直强调这才是大数据的价值。

“取舍”的艺术

“取舍”之道,即为由数成据之道。“淘尽黄沙始得金”,面对互联网上浩若星海的数据,需要秉持一心,去伪存真,才能获得有价值的“据”,而不被数据淹没。作为AdMaster大数据的技术领袖,洪倍会根据实际业务场景的需求来做取舍。“比如有些数据可能算起来很复杂,但却不产生商业价值,它只能描述一个大家都知道的事实,算下来意义就没有那么大。从这些角度,我们会做取舍。”


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-25 00:37 , Processed in 0.080806 second(s), 25 queries .

快速回复 返回顶部 返回列表