不要低估他们的重要性! 原则一:相关性≠因果关系 虽然老生常谈,但是这种情况经常被人误解,我们来比较看看: (1)“我们推广了一周,注册量增多了” (2)“由于我们推广了一周,所以注册量增多了” (3)“当我们推广的时候,注册量会增多” 这种差异很容易被混淆,一个错误的方向可能会导致下一个错误的发生,唯一的解决办法就是通过对照试验来进行判断,不要让因果关系的错误假设影响公司的长期发展。 我们来看2个很有意思的相关性案例: 案例一:2000-2009年美国人造奶油的人均消费趋势与同期缅因州离婚率的趋势对比。两曲线的相关性99.26%(r=0.992558)。 案例二:2000-2009年美国马苏里拉奶酪的人均消费趋势与同期美国获得土木工程博士学位的人数趋势对比。两曲线的相关性为95.86%(r=0.958648) 从以上两个案例可以看出来,虽然两个事件的发展趋势很接近,但是两者之间没有任何的因果关联。所以,不被表象所迷惑,找到正确的因果关系对于数据分析来说至关重要。 原则二:如果分析结果特别好,也许就需要认真检查一下了 用个例子来说明这个原则的重要性。就好比,上周的A/B测试使产品在第二周的用户留存率提高了一倍,当你正激动的时候,有人给你指出错位了一个小数点。更糟糕的是,没有人指出错误,与此同时,许多关于产品、推广、运营的决策都是基于这个错误的结果。 其实这样的事情是可以避免的,只要你认真仔细地检查一切数据。这就是为什么产品数据分析师对他们的分析结果都持怀疑态度,坚持一点:永远对数据保持好奇。 以上两大原则,在数据分析的时候一定要注意喔!
|