2020-04-15宜家数据分析案列拆解

第一步

界定业务问题

围绕WHAT/WHY/HOW三个维度进行数据分析问题的拆解。

WHAT 什么发生了?围绕企业所关注的重点指标

    •  “我们这个月的收入和利润如何?”

    •  “每个顾客在我店里大概都会花多少钱?”

    •  “家具类产品里面是沙发卖的好还是桌子好?”

WHY 为什么会发生?关注业务现状背后的原因

    •  “为什么顾客购买的平均单价在下降?”

HOW 我们能做什么?

    •  “我们如何能让顾客在宜家店里多花钱?”


第二步

数据收集与评估

想要定义高价值顾客,如何获取数据?

这一环节核心讲解数据收集

  •  了解数据库

       ▫  熟悉公司数据库的数据结构,宜家案例中为销售表、会员表与产品表

    数据收取

       ▫  围绕“顾客”,提取关键的数据维度

       ▫  包括:年龄性别购买金额产品偏好门店偏好

    数据拼接

       ▫  在会员表、销售表与产品表中找到对应的数据维度

       ▫  并找到连接各个表单的字段

    数据聚合

       ▫  将所需要的数据:年龄、性别、购买金额、产品偏好与门店偏好等维度进行拼接与聚合


第三步

数据清洗与整理

数据清洗:当发现数据中的缺失与异常值时进行数据处理。

•   该环节往往有三个步骤:

     ▫  第一步:检查原表

         ▫  先检查原表是否是同样的数据

         ▫  该数据来自哪个数据表?在原表中也存在该问题吗?

     ▫  第二步:确认问题

         ▫  检查此数据是如何收集而来,和业务团队确认

         ▫  如果在原表中也存在问题,是否数据收集过程发生了问题?

     ▫  第三步:数据清洗

         ▫  从技术角度评估该是否缺失/异常,以及如何对进行处理

         ▫  该数据是否存在问题?应该如何处理?

在宜家案例中存在以下问题

   •  数据缺失

       ▫  表格中用户性别产生缺失

   •  数据异常

      ▫  有违常识的数据异常

           ▫   -40,000的收入

      ▫  离群值,与其他数据在数值上差异较大

           ▫  10,000,000的收入

      ▫  和其他数据不同

          ▫  99,999的收入

•  数据整理

     ▫  需要对城市的格式进行标准化统一,以方便进一步分析


第四步

数据探索与可视化

针对顾客“累计订单金额”这一数据维度

使用直方图快速找到“高价值顾客”

第一步:抽样

•  从所有数据中抽样十万个顾客数据

•  将顾客的累计订单金额从高到底排列

•  每1万个顾客为1组

第二步:制作直方图

•  横轴表示顾客分组

     ▫  即前30%的顾客,中间40%的顾客,后30%顾客

•  纵轴则是销售收入的累计总和

     ▫  注意:此处是累计值,也就是说第二组对应的数据是第一组+第二组数据的总和


第五步

数据建模与商业决策

如何找到高价值用户的具体特征是怎样的?

仅仅通过‘累计订单金额’定义高价值用户是不够的

要将更多核心变量纳入到分析过程中,

使用python等工具进行聚类分析的建模,

最后获得以下具体画像:

•  城市新居住者

     ▫  购买店面发生改变

     ▫  送货地址发生改变

     ▫  购买产品为生活日用类为主

     ▫  注册手机号与所购买城市不同

•  新婚家庭

     ▫  顾客为男性为主

     ▫  购买产品为家具类为主

     ▫  双人床和衣柜等高价格家具关注度高

•  初为父母

     ▫  顾客户女性为主

     ▫  初次购买儿童/婴幼儿产品类型

使用预测分析模型建模,预测哪些用户会在收到优惠券后使用于购买

在实际业务中:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容

  • 347. Top K Frequent Elements Given a non-empty array of i...
    lulupango阅读 179评论 0 0
  • 今天下雪啦,我和我妈妈一起打雪仗,出去的人真多呀!我们玩了一会儿就回家了,还夹了一个雪球,雪球马上就化啦!
    刘琰朔阅读 293评论 0 0