搜索
大数据中国 首页 行业资讯 大数据应用 查看内容
全球数据经济报告
2019-9-25 12:16 | 查看: 1097| 评论: 0


数据经济的定义、演变和现状

 

定义:概念化和范围

 

近年来,特别是自大规模推出互联网以来,我们的社会、经济、文化和生产环境产生了巨大的变化,例如:人际交流和日常购买决策、企业经营决策等。这些巨大的变化都归功于二十一世纪的技术创新,这种创新达到令人眼花缭乱的程度。

 

数据是新经济的核心。国际标准ISO / IEC 2382-1提供了“数据”一词的实际定义:“以合适的通信、处理方式重新解释信息”。数据是描述经验事实的定量或定性的符号表示(数字、字母、算法、空间等)。数据可以来自不同的来源并且以不同的形式呈现,例如来自交通摄像机的图像、个人照片、社交媒体消息、对话中的声音、房间中的温度、影响作物的湿度水平、每家商店销售的产品数量或产品交付的确切时间。

 

数据被誉为“新石油”、新资源。它也被定义为基础设施资源,因为它可以由无限应用程序来生成。

 

然而,单独的一条数据并不能提供价值。这就是为什么“数据被称为是新的石油”或原油,因为需要对其进行转换(精炼)以使其具有价值。

 

一旦原始数据(例如,声音)与基本上下文信息(metadata)分层,数据就变成信息。

 

在这种新的数据驱动范例中,虽然可以很容易地观察、分析、理解和使用单个数据(简单的声音),但在分析数百、数千或数百万条的数据时,我们将显得措手不及。

 

数据科学可以回答,如(如何缩短运输时间、如何定制广告活动、如何增强产品设计)、节省成本(在适当的时间进行设备维修)等许多其他的具体的实际问题。在这些问题中,最突出的问题包括分析客户信息、欺诈预防、推荐机制、社交媒体分析等。

 

从经济角度看数据经济的演变和现状

 

数据经济崛起最核心因素之一是数据资源量的增长。据软件和信息产业协会(SIIA 2013)称,2013年全球每年存储的数据资源量为161艾字节(1 EB = 1018字节),高于2003年的5 EB2020年全球数据中心流量预计将超过15zettabytes1 ZB = 1021字节)。

 

根据Telefónica执行主席JoséMaríaálvarez-Pallete1的说法,“未来最有价值的资源将是数据”。未来几年数据流量将增加11倍,而信息传输速度将是目前速度的100倍,容量同样乘以100倍。

 

尽管如此,数据量的增加并不是推动数据经济增长的唯一因素。

 

数据经济与其他技术进一步融合,例如连接设备(IoT)和移动、社交媒体、云计算和分析工具。未来随着量子计算的到来,必将带来数据经济的革命。

 

欧盟委员会估计,2015年欧盟(EU)的数据经济达到272亿欧元。麦肯锡2016年估计,2025年欧洲数据经济的国内生产总值可能增加2.5万亿美元。就美国而言,麦肯锡估计,到2025年,物联网、数据分析和在线人才平台可能会为美国经济带来2.2万亿美元GDP

 

大数据及其在数字世界中的重要性

 

大数据通常使用三个V来表征:数量、种类和速度。•数量:最明显的属性,在“大”一词中体现。从兆字节、千兆字节和兆兆字节等不等。•多样性:在数据类型及其来源方面,已经从处理传统数据库中的静态数据到处理:(i)结构化、半结构化和非结构化信息ii)动态或不断变化的数据;iii)由人、机器、传感器等产生的数据。•速度:捕获、移动和处理数据的时间。

大数据:描述和定义

 

大数据今天已经成为全球主要的技术之一。

 

所有这些大数据在哪里?

 

我们现在可以通过将数字转换为“感知”来建立信息或应用程序。

 

社交网络的例子,例如TwitterFacebook,它们向第三方提供应用程序编程接口(API,或者更通俗地说,数据下载连接点),使他们能够提取有关其用户的详细信息。

 

用户在银行、保险公司、大型零售商、超市或时尚服装品牌等地方消费时产生的大数据,现在正在被企业更多地使用,以便更好了解客户的品味和兴趣。如果公司的内部数据库已经成为大数据,那么这些外部资源处理的数据量就会多的令人难以置信。

 

如,在短短一分钟内发送了近50万条推文,或执行了350万次谷歌搜索,或并有近百万用户登录Facebook这些事件中的每一个都是一个巨大的数据表中的新线程,它反映了我们每天所做的事情,我们的感受或我们在哪里花钱。

 

大数据的组成部分

 

前面提到的所有数据来源,都给企业带来了技术挑战,因为与传统资源相比,传统IT系统无法处理这些新数据。

 

新数据来源出现后,面临的主要挑战如下:•需要存储大量数据 •从多个来源获取数据 •数据捕获率 •非结构化数据。

 

传统的数据库,称为关系数据库,是非常强大的,并且保证了一致性、持久性和隔离性,但是它们没有足够的效率来处理上面提出的问题。谷歌和雅虎等大公司正在投入大量资金、研发力量以解决这一不足。他们提出了一种解决方案,以分布式方式(在许多服务器中)存储和处理信息。

 

2008年出现的关键开发技术是Hadoop,它是上述分布式方案的实现。然而,这项技术迅速普及的原因不是它解决了什么具体问题,而是雅虎和Nutch(参与开发的两家主要公司)将其作为开源软件发布,这意味着大量的程序开发者推动了Hadoop技术的发展,并最终演变为工业标准。

 

数据科学:从数据中挖掘信息

 

数据科学可以帮助企业完成数据管理。

 

想象一个巨大的数据表,您可以在其中搜索、添加或转换信息。但到底是什么?它们对企业和公共实体有何用处?

 

虽然术语“大数据”最初是指技术,但它现在已经变得如此受欢迎,以至于它经常被用来指代数据的用途。

 

企业在处理大数据时面临的主要挑战之一是确定他们如何用数据以解决实际问题。一方面,这项工作需要足够的业务知识,但另一方面,它还需要技术知识。将业务问题或转化为可以使用的科学变量,对数据的进一步分析、统计和,以提取出可靠的结论,指导企业决策。

 

负责执行这些职责的专业人员是数据科学家,他们在当今的就业市场中非常需要。他们具备广泛的数学、统计、IT和业务和专业知识。

 

大数据的采用障碍

 

大数据的优点是明确的,现在大多数公司都意识到它的价值。但是,还是存在着一些障碍:不了解大数据可以解决什么问题;复杂性;难以找到所需的人才;难以估计回报;监管问题;如何将专业分析转化为日常应用。

 

免责声明: 除非特别声明,文章均为投稿或网络转载,仅代表作者观点,与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至ab12-120@163.com,我们会及时删除

最新评论

关闭

站长推荐上一条 /1 下一条

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2025-1-15 07:30 , Processed in 0.057279 second(s), 23 queries .