搜索
查看: 583|: 0

企业如何基于信息化发展大数据?

[复制链接]

26

主题

0

回帖

473

积分

中级会员

积分
473
发表于 2019-4-1 10:33:11 | 显示全部楼层 |阅读模式
这几年,大数据的概念很火,上至国家下至企业,席卷全球到处都在讲大数据,可落到很多企业头上却无所适从,不知该怎么办大数据。也难怪,笔者从业才锻短短22年里,信息科技新概念新术语层出不穷,很多新概念仿佛是一夜之间突然不知从哪里冒出来,常常还没搞清这是什么东西,却已经铺天盖地的都是它的标签和广告了,连我这个一直还在IT业内挣扎的老兵常常有被out了感觉。
企业信息化和大数据,如果从两者所采用的信息技术集合的角度,交集的部分是很多的,而且随着进一步的发展,这个交叉集合的成员还不断增加,并且后者把前者看成一种数据的来源,前者把后者看成自己的发展方向,各自有向对方融合的趋势。但是笔者认为,两者之间还是有很大本质上的区别,而要理解这些区别,则还是要从其各自诞生和发展的历史背景来分析。
话说企业信息化的起源,应该可以回溯到20世纪50-60年代IBM公司所推出系列商用大型计算机产品,回顾IBM的发展历史,早期的IBM公司是一家机电商业机器生产企业,并没有专注于计算机领域。在20世纪40年代,IBM的首席执行官老Thomas Watson曾说过,计算机的市场也就能卖出五台,但他的儿子小Thomas Watson后来却领导IBM进入这个领域并且取得了一系列的杰出的成果而获得巨大的成功,让IBM一直雄霸企业信息化行业霸主地位至今。在IT界,与企业信息化这个说法相对应的是个人电脑或者其他个人数字化终端所代表的个人信息化,虽然IBM一度也以IBM PC激活并加入了这个市场,不过后来成为霸主的是苹果、微软、戴尔这些以生产零售消费型个人IT产品的公司,IBM也在2004年把其PC业务卖给联想后退出了这个市场。这里啰嗦一句,很多外行人误以为这笔交易让联想买下了IBM,虽然IBM个人笔记本产品ThinkPad大名鼎鼎,但其实IBM当年在这块PC业务收入占公司总收入不到5%的份额,而且这块业务对IBM来说利润太薄而成本很高,对IBM公司来说就是一块鸡肋,而联想花了十八亿美金买下来对IBM来说是很划算的小买卖,而同年IBM却花了四十亿收购普华永道的咨询业务部才是大买卖,笔者曾任职的全球企业咨询业务部(GBS)就是IBM在这笔收购后在其咨询团队基础上成立的新部门,单单华为公司就曾经给IBM的咨询业务贡献了二十二亿美金的学费,可见这才是大买卖。
我们结合第三次工业革命来理解企业信息化这个概念,计算机结合网络通讯技术在企业中的应用是第三次工业革命的代表之一。以往,人们主要是依靠提高劳动强度来提高劳动生产率。在第三次工业革命条件下,主要是通过生产技术的不断进步、劳动者的素质和技能不断提高,劳动手段的不断改进,来提高劳动生产率,所以企业信息化的本质是把生产力要素通过电子化数字化而形成的信息资源,以支撑生产经营管理者能更好地根据市场需求来配置要素和资源,从而提高生产效率和效益。效率优先是传统工业时代大生产大营销的管理出发点,信息技术能够大大提升这方面的管理能力。企业信息化实质上是将企业的生产过程、物料移动、事务处理、现金流动、客户交互等业务过程数字化,通过各种信息系统加工生成新的信息资源,提供给各层次的人们洞悉、观察各类动态业务中的一切信息,以作出有利于生产要素组合优化的决策,使企业资源合理配置,以使企业能适应瞬息万变的市场经济竞争环境,求得最大的经济效益。从这个分析我们可以看到,企业信息化的出发点是企业,落脚点也是企业,所有系统的开发也是以企业为中心。在工业3.0时代,企业还是一个以自我为中心封闭的经济组织,有明确的边界区分组织内外的人或者物,在企业这种以自我为中心而且内外有别的思想指导下,每个企业的信息化应用都是自扫门前雪,建设需求基本上都是围绕者本企业业务活动以及本企业的人、财、物、流程、场所等生产要素展开,所以只会在企业自己所拥有的业务要素范围内考虑数据的问题,即使个别系统因业务需要和企业外部数据源有所交互,也是通过接口的方式把这些外部数据源作为输入转化成企业内部数据,与大数据概念相对应,企业信息化所积累的私有数据是小数据的概念,为了企业自身信息安全考虑,企业的私有数据大部分是存放在网络防火墙以内的内部信息系统里面的,对其访问和使用有严格的权限和制度的约束,这和大数据产业的概念本质上是不一样的,对于这部分数据,过去称之为企业数据。
谈到企业数据,就不能不还要专门谈谈企业信息化里面非常重要的一支,商业智能与数据仓库(BIDW)。从20世纪90年代起,商业智能和数据仓库成为一个越来越热门的细分技术领域,笔者是20世纪90年代末期根据工作安排进入这个领域,算是国内搞BIDW最早的一批人。对于企业信息化,BIDW是一个很重要的里程碑,过去的企业信息化是以计算机程序为核心的,数据结构是与程序算法结合一起考虑的,在这种以程序为核心的信息化建设思想指导下,数据充其量只是程序的一个附产品,用游客进公园的大门打比喻,公园的大门和验票人员是程序的组成部分,数据是门票,往往用一次就扔废纸箩了,一般也不想有什么后用,这种程序后来有个专门的称呼,叫联机业务处理(On-LineTransation Processing, 简称OLTP)。后来,越来越多的企业发现这些门票大有后用,比如想了解不同时段的客流量等等管理决策方面的信息,就是要从这些最基本的业务活动记录数据中汇总统计而成,而这类为了支持管理决策的数据应用需求被称为分析型需求。早期解决这类需求是先把数据存储到文件或者数据库,然后根据统计需求编写一些报表查询类的程序来满足,但渐渐地,用编程序的方式来满足管理需求明显是一件吃大力而极不讨好的事情,大量的临时性的重复开发让企业信息部门不堪重负。BIDW出现后实现这类需求的解决方案叫联机业务分析((On-LineAnalytical Processing, 简称OLAP),如果我们把企业的业务活动简单看成是让轮子在不停地转啊转,OLTP是负责让轮子转起来,而OLAP则负责观察轮子转得怎么样,根据观察结果让控制者再根据实际需要调节一下转速什么的,这两者的结合才完成一个业务信息化的闭环。OLTP是OLAP的数据来源,OLTP记录下来的每笔业务的活动数据被称为源数据,对于处理一笔业务活动的信息需求来说,OLTP一般只会采集和保存和这个业务活动有关的信息项,而为了获得更高的处理效率和缩短处理时间,企业更会尽量减少业务过程的数据采集工作量,这样一来导致这些源数据必然是碎片化的;而OLAP服务于管理决策的支持,信息越充分则决策越有效,决策所涉及的数据面是很宽广的,而且还需要从多角度多层次来观察数据,直接访问OLTP的源数据明显无法满足这样的分析型需求,所以从OLTP产生的源数据到OLAP的分析型数据,数据仓库负责从各源系统抽取(Extral)转换(Transform)加工后再装载(Load)进来分门别类存放好,给后面的OLAP应用提供数据支撑。
业界大数据(Big Data)概念是始于2011年麦肯锡的报告,而这个概念是从整个人类社会所积累的数据总量的角度来论述的。如果单从数据规模增长的角度看,从20世纪50年代的六十年企业信息化应用发展时间里,积累的数据总量规模也一直都在倍速增加,而为什么到2011年才提出这个概念呢?业界用4个大V来定义大数据的特性,分别是大规模、多样性、价值和速度,并围绕这4方面给出很多种解读,这些笔者也认同,而要理解大数据这个大字,我认为还要从宏观经济的背景来看到大数据是什么,换句话我们可以这样理解,大数据就是范围超越某个社会个体(企业或者个人)的数据范畴。大数据和企业数据本质上属于不同的层面的概念,前者是宏观层面的、具有社会广泛性的;而后者是微观层面的、具体到某企业内部的。虽然业界把企业积累的私有数据也看成大数据的一种来源或者组成部分,但如果把企业数据混为大数据的一部分,我认为就不那么准确了。就好像大海里的水与自家水缸里的水,虽然物质成分主体都是水,甚至这缸水最后也会被倒入河流汇入大海成为海水,但是不能说这缸水是海水。缸水海水都是水,但所处的环境不同也决定了其概念上的不同,而这个不同是更本质的差别,其他什么规模啊、数据格式多样性啊之类的差别我认为倒是次要的了。比如很多企业的数据仓库这口水缸由于需要存储各种历史数据,所以也能做得很大,例如沃尔玛这样企业的数据仓库的体量规模也是很巨大的,但即使其量再大,也是他自家缸里的水,并未不是大数据海洋里的水。
紧接要讨论的是我认为业界目前还没有很明确,却偏偏是很重要的大数据的所有权问题,这个方面说法很多,有人认为谁用上了就是谁的,也有人认为大数据是属于全人类的,换句话说默认是共有的。这些观点虽有可取之处,但也有偏颇的地方,结合当下人类社会的发展阶段来看,如果一种能带来巨大市场价值的资源没有主权是不可想象的,即使是免费共享也不代表提供者放弃主张的权力。而企业数据就没这个问题了,企业数据没有离开企业自身的产权概念,其自然拥有其主权,这和签名肖像一样,起码可以归入IP(知识资产)的范畴。如果我们从这个层面来讨论业界大数据的概念,我认为本质上大数据是一种产业前沿发展思潮或者发展趋势,这种思潮所代表的是如何从现有的可以公开合法获取的外部数据资源中发掘出对自身企业发展有价值信息的一种新商业思维。在互联网之前这么多年,虽然很多有识之士早就在广泛呼吁数据的重要性,但由于没有出现明确的有利可图的商业模式,这种数据的价值也不能直接地兑现成商业利益,而大数据的提出,特别作为一种产业发展前沿来提出,无疑是社会上大量的数据资源的商业化时机已经成熟了。现在这些案例很多了,谷歌、亚马逊、百度、阿里、腾讯,这些利用大数据资源的公司不但股市估值上已经取得很高的溢价,而且这几年通过互联网+到处跨界传统产业,也在股市外的市场货币化兑现他们经营的大数据资产。
这里用这么多的文字论述两者概念的差别是为了让大家能更准确理解其概念和内涵,目的并不在于将两者拉开拉远,反而是希望从传统企业转型升级的角度,探讨如何建立企业信息化和大数据产业发展潮流的有效衔接,所以这里把本文的题目定为“从企业信息化到企业大数据”、而不是“企业数据到大数据”或者“小数据到大数据”等的用意。企业大数据-------这是笔者自己提出来的概念,有两方面含义:
  • 一方面,在大数据前面加上企业两个字,是为了鲜明地表示笔者所谈论的大数据是从微观经济层面的研究,探究大数据思维和相关技术和资源如何落地到具体企业的业务发展战略之中,而非业界所谈的大数据定位在宏观产业角度的趋势分析和研究;
  • 另一方面,“企业大数据”是一种新的思路,和传统一直沿用的“企业信息化”思路是很不相同的,从现实情况来看,当前我国企业按传统思路完成企业信息化建设、特别是达到信息化与工业化融合的目标还有很长的路要走,而”企业大数据“被看成企业信息化建设历程的一部分也是不恰当的,原因下文会给出解释,这里先给一个笔者的观察,我国很多企业会在一定时期内同时建设企业信息化与企业大数据两个体系,采用两个技术架构及技术队伍并行的策略。

我对这种局面打一个有些接近但不完全贴切的比喻,做企业大数据的应用是去海里打渔,而企业信息化的应用则是在自家的水缸里养鱼,数据是水,应用是鱼,如前文的比喻,大数据是海水,企业的“小数据”是缸水,两者的水质自然有很大差别,而最大的差别是缸水是由企业自己收集的,而海水则不是,因此也不能被企业自主控制,能不能在海里抓到大鱼就更不是可以企业控制的了,这是两者无论是数据来源还是应用方式都存在巨大差异的地方。
所以企业开展大数据应用的商业动机,一般是通过拥抱互联网实现获取倍增和跨界的业务发展机会,需要配套的是企业整个经营管理体系向适应互联网化运营的方向变革转型,并跨出组织边界主动出击对外部大数据资源的开发利用来创新(产品和服务)实现再创业,从这个角度我们可以明确企业大数据应用两大核心价值取向,一个是实现创新,另外一个就是支持变革。回顾业界对大数据的4个V特征基础上的定义,在此我们可以给出企业大数据更具体的定义:“企业培养快速处理大量的多种不同格式的内外部数据资源的能力,用数字化手段实现产品、渠道和服务方式的创新,并运用大数据思维和相关技术推动企业的变革”。

而企业信息化的任务是守土有责、修炼内功,一步步提高业务的数据化驱动能力和自动化程度。对于很多传统企业,我们看到如果企业信息化都没有做好就妄图一举成为一个顺丰一样顺水前行的大数据企业,无疑是本末倒置的,大数据海洋里毫无疑问是有鲸鱼这样的大价值可去追逐,但耕耘大海也需要有大海里的本事,如果在自家水缸游泳的功力都还没练好就贸然跳海里去,这毫无疑问是危险的。有人可能反驳说,你看那些互联网企业不是这样干的好好的吗?这里笔者还是要指出,即使互联网创业者有早期创业所谓的艰辛故事,而哪家互联网企业不是资本催生出来的怪胎?如果没有得天独厚的启动资本,这些互联网企业能短时间无所顾忌地烧钱闹这么欢?君不见乐视系的业务不都是先上市再创业的皮球吗,先不论这种皮球能吹多久,这种过于玩虚的商业发展模式是不可持续的,也不是正常的企业可以去玩的,好比买彩票总有人中大奖,可靠妄想靠买彩票来解决生计问题就很荒谬了。
既然我们不能靠运气来把握企业未来发展的机会,如何从做好企业数据这个一亩三分地的小池塘(或水缸)到耕耘大数据海洋、去抓大鱼发大财,放在新工业革命的角度来看,这事关企业的命运和前途,已经是躲不过去的宿命,这么长期而艰巨的任务,如果没有合适顶层设计进行总体谋划、周密安排来规划路径对于企业来说试错的成本就难以承受了,而完成这项顶层设计工作有一套知识完备而逻辑清晰的方法论作为参考对于迷茫其中的企业无疑是雪中送炭。而目前市场上关于大数据的书籍很多,关于企业信息化的书籍就更是汗牛充栋,而同时兼顾企业信息化和企业大数据的发展需要,能有效贯通两个关联密切却差异也巨大的信息化领域的方法建构方面的书籍比较稀缺,这是笔者开展这方面研究和开发培训产品的初衷,我认为零敲碎打的事情很多人在干了,我不去凑热闹也不少我一个,而试图在两座大山之间搭一个桥梁的事情很难,但能解决实际困难和落地实施,也更有意义,我愿意干。
最后,从企业信息化到企业大数据需要的不是分水岭,而是持之以恒的长期理论建构和实践探索的努力,为难于其易,为大于其细,圣人终不为大,故能成其大,能成就大数据的“大”也离不开这个“小”的道理。
转自:https://www.toutiao.com/i6470277466370867725/

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2025-1-15 21:58 , Processed in 0.138685 second(s), 24 queries .

快速回复 返回顶部 返回列表