“从20世纪50年代开始,大数据信息就以指数形式增长。” IBM公司全球大学关系项目总监Jim Spohrer 说 。IBM正在与园区合作,以推动数据分析研究进展。 对于大数据有各种定义和理解,近来麻省理工学院围绕着调研对大数据进行了总结归纳,在报告中列举了以下几种定义: 1.Gartner:2001年,Meta(现在Gartner)在一份报告指出,数据规模日益扩大,数据快速增长,数据格式变化,带动就业形式的变化。这份报告早就采用 “数据挖掘”这个术语,并用了3个V进行概括:Volume, Velocity and Variety(数量、速度和类型多样),有时甚至包括第四个V:veracity(可信性),用于确认问题的可信任和不确定性。 2.甲骨文:大数据是从传统关系型数据库驱动的业务决策价值推导,增加了新的非结构化数据分析。 3.英特尔:大数据存在于组织每周所产生平均300 TB数据中,数据分析最常用的数据类型是关系数据库所存储的业务交易数据,其次是文件、电子邮件、传感器数据、博客和社交媒体。 4.微软:大数据更多用来描述处理所需要的强大计算能力——最新的机器学习和人工智能——数量巨大且非常复杂的信息。 5. 集成知识环境(MIKE)开源代码项目的一种方法: MIKE提出,大数据不仅是数据集函数而且非常复杂。因此,它是定义为大数据数据集的高度排列和交互。 6.美国国家标准与技术研究所:大数据是 “超容量或超过常规方法和系统容量”的数据,换句话说,所谓“大”的概念是相对于现行标准计算而言的。 对此,你将如何定义大数据? |