对于数据分析,我一直强调核心是业务。通过业务的分析逻辑影射到数据分析的处理逻辑。而数据分析工具是帮助我们实现结果的手段。 比如你要做销售数据分析,要知道为什么整体销售额出现止步不前的状况,你需要将这个指标按照不同维度细分。例如按照地域分,有没有哪些地区“情况特殊”;按照时间维度,有没有季节性的波动;按照产品,有没有出现产品分布不合理的状况。所以,你分析的切入点一定与你业务的理解程度相关。 讲一个关于数据分析的笑话:某公司业务员学会了如何从DW中用SQL对数据ETL并建立了Cube。然后算啊算,总算把全年各地区的数据汇总,得出结论:今年营收涨幅不大的原因是2月份营业收入远远小于其它月份。然后进一步挖掘,试图用spss、sas中的数据挖掘模型找出原因但至今无果。扫地阿姨弱弱的说,2月份是春节,几乎所有的公司半个月无人上班… 这个例子告诉我们,脱离实际和业务的数据分析,会走很多弯路。一个问题的分析不一定要从很大的角度,相信销售总监以实际经验早就知道2月份的营收并不是造成全年整体营收下降的主要原因,他更多需要了解的是逐月的销售增速是呈现一个怎样的变动,每个变动对应的一些市场、营销、人员、政策是否有什么变化。 所以把业务问题抛给程序猿是一个比较不明智的决定,业务人员自己着手建立数据分析才是省事又准确的方法。 那业务人员数据分析最关键的就是工具,工具势必要求简单、好上手。 EXCEL 如果能明确分析需要用到的数据,十万以内的数量级上excel是首选。业余学习运用表格功能及一般的运算规则,提高报表制作及计算的效率。再进一步,学习用VLOOKUP、VBA处理一些复杂的运算和复杂的逻辑关系判断,学会做一些智能化的互动报表和动态图表。再进一步,这样的工作已定性化,可以利用其他工具进行VBA的开发,完成程序级的开发应用,这也是企业级常用的,但这样的这样的工程还是交给程序猿来做吧。 以下提供EXCEL处理数据的技能 数据重复:(COUNTIF函数),删除重复项 缺失数据: IF And Or 嵌套函数等 数据抽样: Left,Right,CONCATENATE(文本1,文本2....),VLOOKUP 数据计算: AVERAGE、SUM、MAX、MIN,Date,If 数据分组: VLOOKUP函数,采用近似匹配,SEARCH函数 数据抽样: RAND函数,RAND() 其他工具 实际应用过程会有一些局限性,当你要处理的数据分析,数量在5000以上,维度在20以上或者是所谓大数据的处理,单用Excel就有些吃力了,因为此时的数据往往需要进行建模、抽取、清洗的处理。这就又涉及技术层面的问题,所以这些问题可以交由一些智能化的工具来解决,把数据处理尽可能简化成可视化展示的形式。比如FineBI就是主张脱离技术解决数据分析的工具。 因为是商业智能工具,其在自动建模和数据的抽取、清洗方面展现出良好的“智能”,在百万级别以上的大数据处理基本是秒出,在企业级的流程应用上优势会更明显。 所以,对于工具的选用,视情况、视侧重点定夺。
|