“何为大数据,这里的‘大’不应该仅仅指向体量,更应具是高价值的属性。”神州数码数据专家史文钊认为,大数据不仅是信息技术改变商业世界的杀手级应用,更应该从根本上为政府、企业、大众解决问题,从而为整个社会的繁荣和文明带来价值。 相较于云计算已经进入理性发展,目前大数据还处于较为稚嫩的初期阶段,尤其缺少系统性大项目的成功经验。“面对现状,业界已经开始反思大数据的真正含 义,冷静思考大数据背后的真正价值,尝试构建各种大数据解决方案并应用于各行各业。数据和我们想通过发现问题所得到的智慧是两码事。所谓大数据的时代,不 是数据的时代,而应该是利用数据分析发挥数据价值的时代。我们认为在智慧城市建设乃至政府决策、行业应用中,不断探索如何盘活已有数据存量,用好传统信息 的富矿,将数据挖掘好,分析好,以社会信息数据做补充,通过数据分析和科学建模找到数据相互之间的关系影响,得到传统方法不能得到的认知,进而协助政府及 其它行业提升管理决策水平是大数据价值的关键,这也是神州信息的独特优势。”史文钊指出。 2014年年初,“单独两孩”政策推出,对于这一政策调整,国家卫生和计划生育委员会宣传司司长毛群安曾表示,相关机构和部门为此做了为期十年的研究,而在这个过程中,由神州信息支持研发的PADIS(人口宏观管理与决策信息系统)发挥了相当重要的作用。 据了解,参与评估的PADIS国际版本是中国人口与发展研究中心及神州信息在PADIS一期建设的基础上,在联合国人口司的指导和协助下,研发的一套国 际通用人口预测软件。PADIS微观仿真模拟的具体模式是,建立一个包含1000多万人口的虚拟社区,其中每个功能单元都是独特的,又和诸多因素相互影 响,像是一个栩栩如生的小社会。在这个小社会里,每一个新生儿的存活、儿童的就学、毕业后能否就业、成年人的婚配生育都由输入模型的概率决定。如果要研究 人口社会等问题,只要把具体的政策输入,都可以在这个虚拟社区看到“未来”。 截至目前,PADIS已经在全国及多个省市范围内展开应 用。以广西为例,人口分析和预测不仅要关注城乡数据,更要关注分民族数据,真的无法用人手计算。采用PADIS,输入本地的相关具体数据和备选政策,集群 服务器组运算了两天两夜,依据相关数据结论,最终广西省将生育两个子女的条件从此前的“夫妻双方均是独生子女”放宽为“夫妻一方是独生子女”。 史文钊表示,PADIS预测结果和国际上最权威几个机构的结果相比,准确率能达到99%以上,而这一准确率的背后则来源于神州信息对于数据的精准把控以 及有效的反推验证,“就出生率而言,我们在拿到出生数据的同时,还会通过教育部门的登记数据进行反推,甚至通过幼儿吃糖丸等数据进行倒推验证,以确保数据 的最大化准确和内在一致性。而为了确保分析结论的有效性,我们会通过输入历史数据,然后看系统分析出的结论是否和现状吻合,以验证其可靠性。”除上述这 些,按照联合国技术专家的建议,PADIS还将预测区间设定在往回可回推100年,向前预测400年。 可以看到,技术上的一小步,却是 政府科学决策的一大步。告别拍脑袋,借助大数据分析系统,政府决策正在向科学化、智能化大步发展。值得一提的是,除了调整计生政策,目前,神州信息还基于 人口和经济等关键因素,在大数据分析和建模基础上推出了智慧城市综合决策系统,这一智慧城市综合决策系统在养老金缺口、改善交通、幼儿入园难乃至环境治 理、房价上涨等问题上发挥价值。“在国内,北京、河南、重庆、安徽、黑龙江、浙江、山东、大连等省市已应用PADIS进行区域人口预测和城镇化、老龄化等 方面的分析。”史文钊介绍道。 作为推动城市化、实现科学发展的重要手段,智慧城市建设已经在我国积极开展。“城市是一个开放的复杂巨系 统,系统中包含大量多维异构的复杂数据,人口、社会、经济、资源、环境之间相互关联又相互影响。大数据建模仿真技术为解决这种复杂非线性的系统问题提供了 绝佳的解决方案,不仅为国家政策提供量化的数据支撑,同时也为智慧城市的建设提供核心关键技术。”史文钊认为,之所以在人口、交通、教育、医疗、环境等层 面的诸多尝试,均是为了全面实现智慧城市的发展愿景。 史文钊认为,在IT基础设施和应用层面,我国相较于欧美等发达国家,起步较晚,存 在一定差距,但在以预测和分析为主的第三类应用中,国内厂商和国际厂商同处一个起跑线上,有些大数据解决方案甚至比国外更具优势,有着广阔的发展空间。 “现阶段我们的精力主要放在政府应用上面,希望利用数据技术、建模技术为政府乃至地方政府,在重大问题的决策方面提供辅助支撑。而未来我们的触角也一定会 延伸至企业和个人应用当中去。”史文钊表示。 |