数据分析的流程

WX20180318-174815@2x.png

以我的数据日常为例,简单将数据分析的流程梳理一下。
数据的整个流程可以划分为

  1. 数据目的
  2. 数据获取
  3. 数据处理及认知
  4. 模型分析
  5. 数据结论及方案
  6. 数据报告

明确数据目的

提出问题是数据分析的出发点,出发点不明确的话,数据分析也像无头苍蝇。
出发点一般分为两类:验证型和探索性

  • 验证型验证型一般针对已经发生的业务现象,比如这今天的gmv突然从昨天的100万跌倒了30万,这个时候出发点就是:gmv下跌的原因。这个时候就从下跌的关联数据开始分析为什么下跌,得出结论后提出对应的解决方案。
  • 而探索性一般针对未知,比如针对用户的购买记录进行价值分层,这个时候的出发点是:用户价值分层。这个时候就没有一个明确的业务现象,而是需要去探索如何定义价值分层,并通过哪些维度来实现,实现了分层之后对经营的建议。

获取数据样本

要想分析,必须要先有数据。数据源可以分为外部和内部两种,这里重点针对内部数据,分析得最多的一般也是内部数据。
外部数据源一般包括爬虫数据&行研数据等,外部数据一般都需要花费较大的数据清晰的精力。内部数据源一般指的是平台用户使用产品所产生的各种行为数据,以电商行业为例,用户的浏览记录,uv&pv,购买记录等。
内部数据获取及清洗一般使用 sql+excel+python的形式。

  • sql的话算是数据分析师的必备技能,常见的要分清 jion的各种用法,group by分组以及常见的函数如 sum() avg() count()等
  • 除了sql的代码技能,就是要设计好取数口径。一般通用的指标没有特别口径,如果涉及到特定用户行为的挖掘分析,就要多复盘几遍代码是否有遗漏和逻辑是否正确。
  • 尽量可以再sql里完成部分的清洗和计算,这样出来的样本数据比较干净省心。

数据处理及认知

拿到sql跑完的数据可不是直接不久能用的,还要进行处理和认知,数据处理一般针对脏数据和缺失数据。
对于脏数据一般是做删除处理,比如已经注销的无效用户。另一个就是缺失值的处理,对缺失值可以进行填充或者删除。

  • 填充一般使用字段的 中位数或者算数平均值,如果值波动很大使用中位数,波动不大可以使用算数平均值。还有一种填充方案是使用其他字段或者临近记录的字段值。
  • 删除是需要慎重考虑的,虽然字段值有缺失但是这个字段值一样可以传递数据信息。举例一个用户的首次购买时间字段是空值,这个时候空值传递的信息是 这个用户并没有完成购买转化。

数据认知主要是对值的分布有一个大概了解,数据是不是异常分布的。一般可以通过 算数平均值&中位数&方差等了解到。
在完成数据认知后,有的时候要再要对数据进行处理,视分析的目的而定。举个例子:在分析普通用户的购买金额转化分布时候,特大客的金额最好是要剔除的,否则将会影响一般用户的结论描述。

模型分析及结论

在模型分析阶段主要用tableau+python
常用的模型有

  • 漏斗模型
  • 矩阵模型
  • 用户价值分层模型
  • 购物篮模型
  • 留存模型
  • 回归模型
    先写这么多,留坑待填

而且在分析的过程中,结论是一点一点明朗的。

解决方案及报告

得出了结论后,数据分析师并不能只交个结论啊,还要结合当前的业务现状对结论做出解读和方案的建议。
大家都在讲数据驱动业务,但是很多公司其实都没有做到或者做好,也很难做好。
报告的话就是可视化了基本,老板都喜欢图,直观易懂,没有人会愿意看一大堆文字。文集里也在连载可视化的文章,首选tableau,python也有很多包可以用。

做数据分析,得出结论和方案不算很难,难的是如何推动数据结果落地。


我的tableau public:yangliang的tableau public主页

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容