博观而约取,厚积而薄发——苏轼 这是大数据中国网专访银联智策联合创始人、首席运营官(COO)呼延如生博士后,对银联智策最直观的感受:前瞻的战略思维,清晰的商业模式,精深的技术积累,高端的人才配备是这家金融大数据服务企业最显著的特征。 苏东坡十个字,说尽古今多少做人、做事、做学问的道理。“博观而约取,厚积而薄发”,创业的道路往往很漫长、很寂寞、充满挑战与艰辛,与现在很多人所思所想的“短平快”相去甚远。呼延如生的大数据思想发轫于数据科学规模化应用之初,在博士研究期间开发了美国首例基于大规模自然语言处理的远程医疗实时诊断技术。在毕业后不到10年的时间里,他敢为人先,在美国先后主持研发了SAP金融产品实时定价系统、CapitalOne金融大数据风控与决策体系,并于2012年主导了MasterCard在亚太地区大数据业务的战略实施。自2013年始,大数据概念在国内家喻户晓,大数据创业如火如荼,而成立于2012年12月的银联智策,始终秉承其创始者“行胜于言、自强不息”的理念,悄然走到了国内金融大数据服务领军者的位置。银联智策如何做到大数据思维创新?其经验又如何为大数据同仁所借鉴呢?呼延博士从五个视角为我们揭开大数据思维之谜... ... 历史视角--大数据革命 大数据中国网:您是如何理解大数据的发展历程呢? 呼延如生:清代龚自珍《定庵续集》里说:“欲知大道,必先为史”。把握事物的发展史,才把握住现象背后的规律,从而对未来方向做出推断。“大数据”作为一个全球性的现象,要首先从历史角度来观察和思考。我们知道,历史上有三次工业革命:第一次是以蒸汽机的发明为标志的机器革命;第二次是以电力的广泛应用为标志的电气革命;第三次是以计算机的发明与应用为代表的信息革命。第四次工业革命以数据时代与智能制造为代表,可以简单理解为是围绕数据与智能技术而展开的革命。 第四次工业革命有两个主体热词,一是大数据,二是人工智能。大数据是新的生产要素,是基础性资源和战略性资源;人工智能是数据科学的高级阶段,是大数据时代的重要生产技术。要理解这次革命,就要理解其本质上是技术的革命,在深度和广度上都有可能是空前的。四次工业革命中,前两次是机械与电子的范畴,第三次是信息与计算科学的范畴,而此次工业革命则是由数据科学驱动的。要理解这次革命,还要把握好量变与质变的关系。数据科学的发展是一个渐进的过程,放眼全球高校,MIT、UC Berkeley、清华大学等知名学府均设立了大数据相关的研究院所,其核心课程主要包括数学、统计学、计算机科学以及商业分析,面向大数据上层应用的独立学科体系尚未形成。由此可见,大数据革命尚处于相对初期的阶段,而这个量变过程在国外已经持续发展了相当长一段时间。2000年以前我在美国开发基于自然语言处理的实时医疗应用系统,运用分布式技术处理海量数据,从软、硬件的设计思想看,都与如今大家耳熟能详的大数据技术基本一致。在硅谷,以Google为代表的互联网公司创造了MapReduce等技术,在由Doug Cutting开源后极大推动了大数据技术的应用与发展,直至2013年大数据概念蔚然成风,相关技术储备已经历了10余年。银联智策在2012年就以技术革命史观,携前沿技术布局中国金融大数据行业,与同仁们共谋“数据创造价值,策略提升效率,创新引领未来”的宏伟愿景。 哲学视角--大数据存在 大数据中国网:有观点认为大数据的核心是大数据思维,您怎么看呢? 呼延如生:“星星之火,可以燎原”。我们要在大数据这个行业做好就一定要概念上准确、方向上明确,否则将欲速则不达。因此有必要从思辨层面将这个问题剖析清楚,也就是说大数据思维实际上是一种哲学思维,可以追溯到古希腊哲学家毕达哥拉斯,他以“数是万物的本原”的论断将数据提高到本体论高度。科学发展到现在,我们可以从世界的四个维度来理解大数据的本体论:物理与自然、生命与生物、经济与社会、网络与虚拟空间。这四个维度可以解释为关联和递进的,大数据产生于网络与虚拟空间之上,汇聚了四个维度世界的海量信息,从而达到一个更高的维度,可以是混沌,可以催生智能。与人工智能技术相结合,大数据可以为传统行业赋能,改变这些活动现有的组织方式。 本体论之外,大数据思维还要回答认识论的问题,也就是大数据的辩证法。我总结出三点:1、统计的辩证,也就是统计学上讲的偏差与方差的辩证,指导我们演绎与归纳;2、计算的辩证,也就是计算机科学里运算时间与空间的辩证,指导我们建立弹性的海量数据吞吐体系;3、隐私的辩证,是可用与可知之间的辩证;既要保护用户的隐私,又要确保分析结果的准确。这是实际工作中解决大数据问题非常有意义的方法论。银联智策要应用海量数据帮助金融企业改变他们的生产组织方式以及与客户交互的关系,就要用好这三个辩证法,建立基础设施,开发智能算法,支持客户把金融业务软件化、服务化。 |