进入大数据时代后,数据统计、分析被视作兼具“前景”和“钱景”的行业。一时间,擅长发布各种数据的机构和单位如雨后春笋般层出不穷。可是,大数据真的那么可信吗? 之所以有这么一问,是因为近期连续遇到几起数据“乌龙”事件。例如,某网络平台发布报告称,平安、民生、广发、天津等4家银行在上海停止发放房贷,停贷银行占按揭银行总数的13.33%。可真相是工、农、中、建、交五大行约占上海所有银行网点的六成,这些网点都正常接受房贷申请;而天津银行在上海的网点总共才7个,其他3家所谓停贷的银行也是从年初起就调整经营战略、压缩房贷业务。从这些基本的情况不难推断出,13.33%的停贷比例是站不住脚的。还有一个数据是今年“双十一”过后第二天,某互联网机构称“双十一”退货率已达25%。然而,当时大多数网店还没开始发货,消费者又怎么可能退货呢? 大数据时代,抢着挖掘金矿的企业和机构越来越多,应声而动的商业敏感自然值得赞赏。但对他们提供的数据乃至一些所谓完整的调查报告,则需要谨慎分析。 一方面,那些数据发布方是否严格按照统计学的原则进行调查研究依旧值得商榷。据笔者了解,数据统计和分析行业内的企业和机构多如牛毛,规模大小不一,水平参差不齐。有些调查机构为了尽快完成数据收集和调查报告,不惜违背随机、客观采集样本的根本原则,通过花钱买样本的方式进行数据收集。根据这些数据得到的报告,显然与事实有很大的误差。 另一方面,很多数据发布方的立场也值得商榷。绝大多数发布方都标榜自己中立第三方的身份,可不要忘了,发布的根本目的是用数据换金钱。所以实际运作时不可避免地会牵扯各种商业利益,从而可能影响数据的准确性。更有些不靠谱的发布者,则把数据变成商战中的武器,或者以发布耸人听闻的数据来扩大自身影响。 与其他评价方式和表述手段相比,数据无疑最直观。也正因为此,社会对数据的真实准确性抱有很高的期待。大数据时代需要我们拿出更加谨慎的态度,对数据的收集、统计以及发布者立场多问几遍“准确吗”,而不是一味贪图数据的简明扼要。只有这样,才能从浩瀚的数据海洋中找出真正有价值的部分。 |