搜索
查看: 3215|: 0

[行业资讯] 企业勿盲目追风“大数据”

[复制链接]

152

主题

47

回帖

2995

积分

管理员

积分
2995
发表于 2013-10-10 00:01:04 | 显示全部楼层 |阅读模式
       大数据的概念仍很模糊,因此企业用户应当明白——大数据到底能够做什么以及大数据有哪些局限性?因此,企业用户在制定战略时,需要弄清以下五个问题,这样才能确保最终从信息网络中获得有用的信息。
  1、了解你有什么问题?
  这似乎是一个非常明显的问题,不过,多数企业都有一种被“数据驱赶”的压力,这些公司可能在未弄清手中的问题或机遇时,就开始率先追赶大数据。你是一位无法将需要的数据填入电子表格的业务分析师吗?你无法率先获取公司的大数据吗?你是一位负责减少搜索等待时间的首席信息官吗?你是一位厌倦了等待搜索结果达数日之久的非技术用户吗?你的数据是结构化还是非结构化的?还是你面临着上述所有的问题?当然,你可能面临的一个问题是“预算”,特别是对初创企业和中小型企业而言,因为数据存储的价格及相关的硬件价格非常昂贵。
  2、支付自由软件(开放源软件)的成本是多少?
  Hadoop一直有着很多争议。尽管其是一些企业所需的开放源解决方案,但是,自由并不意味着就不需要支付费用。Hadoop可以在一些日用硬件上运行,但这需要一些投资,例如需要消耗电能,并连接到其它一些设备上。
  3、考虑规模因素(包括企业规模和数据规模)
  大数据的规模动辄就以10的15次方字节来计算,但是,多数企业用户使用兆兆字节的数据。如果在兆兆字节的范围内工作的话,那么一大群机器所需的成本可能将难以支付。如果用户需要兆兆字节的数据规模,那么至少将需要一台单独的服务器,为此,用户需要尽可能降低成本,增强简捷性,以便一台服务器能够发挥作用。
  4、你的数据在哪里?
  如果用户的多数数据都是应急备用的,那么制定的战略就应当与云数据不同。例如,如果你的数据存储在 亚马逊 或Rackspace的云服务之中,那么在这样的框架内运行大数据方案将会非常有意义,因为这种数据能够很容易在那种环境下转移。不过,如果用户的多数数据都是应急备用的,而且用户还考虑在云中运行大数据,那么用户就应当三思而后行了。大数据很难随便移动,向云设备上传大数据并保持同步性将会面临很多的挑战。
  5、不同技术之间的区别是什么?
  目前用于大数据分析的技术有三大类型:软件数据库应用方案、硬件数据库应用方案和分发式数据库。软件数据库应用方案往往部署在日常硬件上,一般都是在一台独立的电脑上,这样的成本较低,而且便于构建,如果SQL server或MySQL。硬件数据库应用方案由与硬件捆绑在一起的软件组成。分发式数据库主要是指部署在多台电脑上的软件,这种数据库将便于用户平行存放和处理数据,但这种数据库结构较为复杂。
大数据中国(http://www.bigdatas.cn),以数据的力量改变生活!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-22 00:00 , Processed in 0.181172 second(s), 33 queries .

快速回复 返回顶部 返回列表