【案例一】样本的代表性
1936年《青年文摘》对美国总统大选的结果进行预测,结果失败,问题出在调查方法上(调查对象是其读者,调查方法为电话调查)。1936年有能力购买电话和订阅杂志的人并不能代表所有的选民,至少在经济上,他们是一个极其特殊的群体,是有偏的,事实后来证实他们有许多人是共和党的选民。但是如果调查选择的样本是代表性的,能代表全部选民那么调查就能得到准确的预测结果。
l 盖洛普为什么预测美国大选的结果很准确?他们采用抽样调查方法,在全国各州按比例选择调查对象对总体有很强的代表性 。
【案例四】平均数的陷阱
假设你是某个小型制造企业的3个合伙人之一,到了月底给企业的90个职工发了99000元,你和合伙人每人共获得5500元的工资,最后还余下21000元作为利润可供你们3个合伙人平分。你会选择哪一种表述公示呢? 肯定是后者,因为显得收入分配更公平,但其实每个人拿到的钱还是和前者一样。因此需要特别注意这些平均数背后的真相。
l 国家统计局发布《2009年国民经济和社会发展统计公报》,其中称“70个大中城市房屋销售价格上涨1.5%”,数字公布之后,引起了代表委员和社会舆论的广泛质疑。从数字看起来房价上涨很少,但为何与我们的感受不一致,主要原因还是在于平均数,这一数字对房屋种类、地区、地段、楼层、朝向、时点等因素而差异较大的样本进行综合平均统计,过度消除了价格变化。
l 统计局公布1月CPI数字,因为春节假期央行再度加息,市场曾预期1月CPI必将再创新高,甚至有望接近6%数字,可实际数字4.9%却让人颇为意外。原因就是统计局CPI统计的新权重:居住类、医疗保健类、娱乐教育文化类价格权重上升,食品类权重下降。而食品类价格却是百姓感受最明显的一个指标,因此平均时权重差异也使得我们感受与数字之间产生差异。