最全总结,数据分析的标准流程,收藏!
数据分析是业务决策的重要工具,但很多数据分析师在实际操作中却常常感到困惑,不知道如何将数据转化为有价值的业务洞察。本文将系统性地介绍数据分析的标准流程,帮助数据分析师理清思路,更有效地支持业务决策。
“数据分析的标准流程是啥?”
“为啥感觉自己只取了数,看不到结果?”
“分析做到什么地步,才算是对业务有用?”
经常有人有这些疑惑,今天我们来系统讲解下,数据分析的标准流程,帮大家理清思路。做数据分析其实有2种基本流程和6种具体情况,我们一个个讲。
一、从问题出发的流程
此类流程,典型有三步:问题→数据→答案,一般业务部门会沿着这个路径思考。比如你是一个销售主管,你最关心的肯定是自己业绩表现,于是你会先看:
- 问题1:我的团队业绩如何?
- 数据1:当月达标情况……今年累计达标情况……
- 答案1:目前已达标,超额20%
当然,有可能你思考得更深入一些。
比如公司目前有一个业绩排名奖:全国每月同比增长排名前5的团队,可以拿一笔奖金。现在已经20号了,你很想知道自己有没有机会拿到这个奖。
于是,你会进一步分析:
- 问题2:目前排行+未来10天预计增速,能否让我拿到这个奖
- 数据2:截至19日,同比增长排行……未来10天,各团队预计完成情况
- 答案2:从目前行业+未来增速来看,我能/不能拿到奖金
注意!问题2比问题1要复杂很多,因为问题1只需要统计历史数据就好了,问题2得预测未来10天的走势。
在怎么预测上,可能有好几种方法,比如:
- 简单用前20天趋势,模拟未来10天走势(趋势外推)
- 根据去年同期的走势,模拟未来10天走势(周期性分析)
- 根据手头尚在跟进的客户*预计转化率,推荐结果(业务模型)
- 根据销售人数、销售费用等数据建模,再预测结果(算法模型)
这就是我们常说的:复杂需求。当需求变复杂的时候,数据分析的流程也会变长,主要在数据环节,越复杂的方法,需要越多的数据准备。那么,有哪些是复杂方法呢?
二、四种复杂度下,分析流程
复杂度一级:认识现状。
这种最简单,直接统计历史数据即可,比如截至1月3日,今年新增加的用户数/累计完成的销售业绩;1月3日时间点上,商品库存有多少等等。注意!单纯罗列数据,并不能解释现状好坏,需要数据+判断标准,比如累计销售业绩+业绩考核标准,这样才能发现问题。
在这种情况下,数据分析流程就是:业务想了解现状→统计数据指标+判断标准→描述现状。
复杂度二级:原因分析。
典型的问题,比如业务问:“为什么我的业绩没达标?”注意,此时业务有假设和没假设,处理流程不一样:
总之,想做得深入,一定要业务题假设才行,不然数据自己把指标拆来拆去,很有可能只输出诸如:“因为人数少了,所以没达标,建议把人数搞高!”一类肤浅结论。
复杂度三级:优化表现。
典型的问题,比如“我要怎么做,才能让业绩冲第一”。此时,需要把前边两个复杂度的问题全部做完,才能有结论。
所以,优化表现类流程会特别长。很多数据分析师不知道怎么提业务提升建议,其实就是因为缺少了前边这几步铺垫,啥情况都不了解,肯定没法直接提建议。
复杂度四级:预测走势。
在上一节已经举过预测例子,实际上,凡是预测类的问题都很复杂。起码得先了解现状,知道问题点,知道业务有没有计划做改进动作,收集一大堆信息以后才能做合理预测。
此时:
如果不考虑业务动作,那么可以直接用趋势外推,分析流程就很短:业务想知道预测结果 → 观察过往趋势→按过往趋势拟合函数→直接外推结果。
如果业务想考虑自己的动作,比如“我追加投入会怎样”,这时流程就复杂了,业务想知道预测结果 → 观察过往趋势→建立模型,量化投入影响→代入参数,预测结果。
总之,业务上提问越复杂,需要分析的环节越长,前期铺垫越多,不然很难输出有价值结论。
三、从数据出发的流程
还有一种情况,就是业务端没主动提需求,但是数据分析师需要主动从数据里读出业务含义,发现业务问题。此时的基本流程是:数据→问题→答案。
但是!这个流程经常走不下去。因为很多很多数据分析师只看得到数据,对业务情况不了解。因此不知道该怎么解读这个数。比如:
- 知道累计销售额是多少,但不知道业务考核标准,因此没法解读“好/不好”
- 知道销售排行是啥,但不知道业务的排行奖励细则,因此没法看出谁有潜力拿奖
- 知道销售不好,是因为某个产品卖得很差,但不了解产品属性,没法深入分析
因此本篇用了很长篇幅介绍业务视角如何展开分析,就是为了提醒那些每天对着报表发呆的同学,多和业务沟通,多加深对业务背景/业务状况的了解。好在,有很多公司业务和数据沟通还是很紧密的,因此,可以优化下“数据→问题→答案”的基本流程。
比如:从异动出发,数据→异常波动→业务沟通→问题确认→深入分析/问题结束。这种一般是数据分析师发现了指标异动,之后向业务确认。如果异动是业务主动发起/早就知道/已经采取措施应对,那就不再纠结,如果是意外情况,就再深入分析,直到落实问题原因。
比如:从标杆出发,数据→寻找标杆→业务沟通→可复制性确认/问题结束。这种一般是数据上,发现某个产品/某个地区/某个渠道表现特别好,此时数据可以向业务主动确认“是不是一个机会点”“值不值得推广”。如果业务早就知道了,那就结束。如果业务感兴趣,就深入分析标杆可复制性,推动标杆推广。
比如:从部门联动角度:数据→关联情况分析→信息共享→问题确认→深入分析/问题结束。这种一般是做经营分析的时候,比如发现销售走势下滑,提醒供应注意积压风险;比如发现营销花钱很猛,关注现金流;比如发现业务计划大活动,提醒客服/售后准备。先共享信息,再看相关部门是否有应对,如果没有应对再深入分析。
以上,所有流程总结如下图,方便大家取用:
本文由运营派作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于运营派,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
棒!这篇写的很通俗易懂
已经发文章转发到公司微信群了,也让大家学习学习。
作者的经验很丰富,文章中提到了很多实用的方法和技巧
优秀,值得我敲下键盘留个言!
我刚进职场的时候,按照领导安排的任务完成,持续几个月后发现和同行差距很大,这个时候我意识到自己可能是青蛙效应的那只青蛙,把青蛙丢进油锅,青蛙是会跳出来的,而把青蛙放温水,青蛙是会被煮,所以我开始给自己寻求工作外的目标,尝试跳出舒适区,最终自己得到了积累。