IT业的迅猛发展带动了整个产业的发展,带来更多的机遇与挑战。近期一场北京云计算技术会议上,微软亚太研发集团中国云计算创新中心总监王枫先生带来主题为“大数据的新世界”的精彩演讲。 王枫认为现在IT行业已经进入到一个新的阶段,现阶段有三个主要趋势。首先是云计算,其次是物联网,最后就是大数据。 王 枫强调,云计算能带给人们3大优势,①经济②快捷③通过云计算实现更多创新,这三大优势引出一个关键词“资源池”,资源池是云计算的基础,所有的基础设 施、应用,离开数据只是摆设。从物联网的维度理解,它是对所有目标的属性采集、存储、跟踪、管理和分析,归根结底是数据。大数据是我们应当关注的重点,大数据的生命周期、属性和一些重要环节,究竟“做什么,怎么做”才能充分挖掘大数据给企业、给IT产业带来的价值。 “数 据不是近几年才有,为什么今时今日才进入到大数据的阶段?因为现在移动设备和社交网络应用带来的数据量增长,已经到了一个非常大的程度。那为什么现在才谈 论大数据?大数据比数据之‘大’,区别在哪?相比以前,我们想要对数据处理更高效,这需要在存储、运算各个功能有足够的准备,同时能够降低它的成本,云计 算、大数据已经到了可以给企业和政府带来经济效益的阶段,基础设施处于软硬件条件就绪的阶段。”王枫在会上说。 在分享完自己对一些产业概念的看法之后,王枫继续讲,微软认为大数据的生命周期分为三阶段。其一,数据采集。第二,数据存储,使用什么安全技术、不间断和高扩展性的数据存储。最后,怎样以此为基础,通过已经过滤、整合的干净数据,而在之上作分析,作格式化的展现。 对 于大数据的生命周期,王枫谈到大数据对存储要求很高,眼下企业可以采用的存储无非有以下几大类。可以是最传统的IT手段,企业拥有自己的数据中心,可以是 传统物理机模式;或者是一个私有云;还可以选择公有云,但这其中最大的担忧源于安全,公有云可以降低运维成本,而企业监控下的私有云或是传统数据中心,可 以自己控制安全级别,提高效率。 从存储角度,核心技术有两点,1,关系型数据中心,2,非关系型数据中心。举例来说,微软的 SQLServer不仅可以分析处理结构化数据,各种类型的数据,SQLServer都能存储,还能够自定义数据类型,由于SQLServer是关系型数 据库,所以对于大数据,能够利用各种技术来索引、查找。 另一方面,非关系型数据存储和关系型的主要区别是什么?非关系型数据,例如 多媒体文件,用户只需关注数据的存取,简单的查询基本属性,无需繁琐的关系型操作。SQLServer从性能、效率和操作的便捷上比关系型数据库有优势, 从这点来讲,这是两个不同的技术。在微软来看,SQLServer是微软的大数据平台,尤其是存储方面。 |