偶然读到这一书,仅看了开头就有了醍醐灌顶的感觉,决心好好把这本书读完,并且在这里做读书笔记。本文仅作为个人读书笔记,不做任何商业用途,有关资源如果涉及侵权,立刻删除本文。
流程
首先,书本提供了做数据分析的问题导向的模型思维,即获得问题后,需要通过以下流程来思考:
1. 确定问题
分析师尝尝因为对问题的理解不到位,而出现为了解决问题,报道长篇大论而不得要点,抛出数据而把解决方案丢回给客户的情况。因为,作为数据分析师,需要首先和用户确认问题要点。例如,CEO告诉你,你帮我想想办法,怎么提高产品A的销量?此时,我们先和CEO确认问题关键:
a. 销量需要提高到多少?是否合理?
b. 您觉得我们应该怎么做?
c. 我们竞争对手销量如何?
d. 目前公司能提供的资源支持,营销预算如何?
等等,明确问题是解决问题的关键。
2. 分解问题
获得一个大问题时,我们需要尝试把大问题分解成小问题,然后通过解答小问题而找到大问题的答案。(像我这种笨的人应该适合,聪明的也许能一眼看出问题)这个时候,我们或许有两个东西:一份原始数据,以及客户提出的问题。当把客户的问题确定以及分解后,我们便需要确定以下问题:客户确定的观点有哪些?我对数据的想法有哪些?
这一步能帮助建立分析问题的框架,从而产生后续分析的指导方向。
3. 评估组块
现在,假设你已经明白问题是什么,关键在哪儿,可能可以怎么做。那么,我们就到了评估的位置。
所谓评估,关键在于通过比较,完善与验证之前对问题的思考。这一步将要用到分析手段和分析工具,切记自己介入分析流程,作出自己的假设,并且用自己的信用为自己的结论做保证。对分析负责将提高自己的参与度,让自己成为问题的决策人,并能让客户来信任自己与理解自己。
4. 提出建议
作为数据分析师,你的职责是让自己和客户仔细研究我对数据的评估,洞察先机,从而有能力作出更好的决策。所以你提出的建议不应该只是建议,更需要有你对问题的设想和判断,确保自己的意见传达到位,从而让决策人更好地作出决策。
你提交给客户的报告要以得到客户理解、鼓励客户以数据为支撑作决策为重点。
以上是获得一个问题后,进行的基本分析,然而现实中分析问题,我们可能会遇到不完整或有偏差的数据,此时我们需要调动自己的心智模型,用合理的统计模型来解决新的问题。心智模型在分析中狭义地说,即一个人面对问题所能调用的知识存量。一个人明确自己的知识体系范围极其重要。
在解决一个问题时,我们需要再必要时,调整我们的心智模型。比如我们想要提高产品销量,却发现目标客户群体市场已经饱和,那么我们此时有两个选择:一,放弃改变策略;二,改善自己的心智模型,在认知以外去发掘新的机会,比如调研产品的下游市场,发现本该卖给11-15岁少女的保湿产品卖给了老年男性,原因是能提供剃须后的皮肤保养。这样一来,我们就突破了固有的心智模型,在全新的基础上去调整自己的分析和建议,协助决策。
附录:
这里我们用反查的方式,去明确自己不能做的界限:
1. 我对机器学习的代码本质不清晰,只是明白部分模型的用途,和拿到代码如何修改适用于数据集。
2. 我对统计学的知识已经忘了大半,需要重新捡起来,回归模型如何调整,包括格兰杰因果分析、ridge回归等,需要重新学习。
3. Python现在只学到了list的应用,pandas还没学,爬虫不会,基本可以说啥也不会。Tableau等数据可视化也不会调用Python函数。
4. SQL只会简单函数,太久不用,Windows都不会用了。更别说更难的代码。
5. Excel的数据分析模块很多也不熟悉,需要学习。
6. 没有合格的产品思维,拿到一个问题就是两眼一抹瞎,什么都得现拼现凑。
7. 不会的太多,先列以上这一些,补充上了以后再说还能再做什么。
就我个人而言,仅仅是数据分析的基本技能,我能熟练掌握的可以说基本没有,这样的我是没有任何求职能力的,如此激烈的互联网求职环境,我不能指望别人对我的应届生身份有任何同情。