淘宝乐高市场分析案例

1、前言

本报告基于30天淘宝乐高销售数据进行分析,主要探究以下3个问题:
(1)什么价位的产品市场竞争小,收益高?
(2)不同价位的产品如何分布?货源在哪?
(3)Top卖家的市场策略是怎样的?
用到工具:python(pandas、numpy、jieba)、Tableau

2、数据读取与处理

  • 数据读取
import pandas as pd
import numpy as np
tb_df=pd.read_excel('C:\\Users\\zsc\\Desktop\\淘宝乐高销售情况\\乐高淘宝数据.xlsx')
tb_df.head(10)
image.png
tb_df.info()
image.png
  • 字段说明:
    goods_name——宝贝标题
    shop_name——店铺名称
    price——价格
    purchase_num——30天内付款人数
    location——卖家地址
  • 对整个DataFrame去重复值
tb_df.drop_duplicates(inplace=True)
tb_df.info()
image.png
  • 缺失值检查与处理
tb_df['purchase_num'].isnull().sum() #结果为0,无缺失值
image.png
  • 重置索引
tb_df=tb_df.reset_index(drop=True)
  • 提取并转换 purchase_num 字段的数值并命名为purchase_num1
tb_df['purchase_num1']=tb_df['purchase_num'].str.extract('(\d+)').astype('int')
  • 计算销售额 sale_amount 字段
tb_df['sale_amount']=tb_df['purchase_num1']*tb_df['price']  #付款人数*
  • 对宝贝标题进行搜索关键词分析
#jieba分词
import jieba 
result_list=jieba.lcut(tb_df['goods_name'].str.cat(sep='。'))

#词频统计函数
def word_fre(jieba_list):
    list1=[i for i in jieba_list if len(i)>=2] 
      
    list_set=set(list1)
    
    list2=[]
    count_nums=[]

    for i in list_set:
        list2.append(i)
        count_nums.append(list1.count(i))
    
    dataFrame=pd.DataFrame({'word':list2,'num':count_nums})     
    return dataFrame

#关键词数据导出,用tableau做词云图
word_fre(result_list).to_csv('D:\\tableau\\lego_ciyun.csv')
  • 将处理后的数据导出,使用Tableau进行数据可视化

3、数据分析与 Tableau 可视化

  • 新建价格数据桶,将所有产品按[0~50),[50,100),[100,200),[200,300),[300,500),[500,1000)进行分类。利用分组分析法进行探究与分析。


    数据桶.png

3.1从市场价格维度进行分析

3.1.1 什么价位的乐高最受消费者欢迎?
  • 价格区间的销量饼图。


    各价格区间商品销量饼图.png

    乐高价格越低销量越高。在0~50元的乐高最受消费者欢迎。

3.1.2 那个价位的乐高市场是理想(竞争小,市场份额大)的?
  • 各价格区间商品数量


    各价格区间商品数量

    各价格区间商品数量帕累托图

目前0~50元区间的乐高数量最多,占所有乐高数量的26.06%,竞争最为激烈;
200元以上的商品比较少,只有不到20%;
竞品最少的是定价在1000元及以上的产品。

  • 各价格区间的销售额


    image.png

    ·
    ≥1000元的商品,销售额最高,占据总销售额的32%.


    销售额帕累托图

单价100~200元和300元及以上的产品占据总销售额的79%;
这是一个典型的二八定律。

  • 对价格区间的理想程度进行指标化衡量
    这里定义:如果某个价格区间销售额越大,而在售的商品数越少,那么这个价格区间的理想市场分越高。
    理想市场分 = 价格区间销售额占比 ÷ 价格区间商品数占比


    理想市场分

综合各价格区间商品数量分析, 售价≥1000级别市场是最理想的,其次是300-500元和500-1000元。

3.2 对卖家特点进行分析

3.2.1 卖家在全国范围内是怎样分布的?

商家的地理分布一定能反映出资源的地理分布,顺藤摸瓜就能找到货源优势地带。

  • 卖家整体分布图


    卖家整体分布

整体分布在广东、上海、北京等经济发达地区。

  • 卖家最多的城市Top10


    各城市店铺数量

    卖家最多的城市Top10

    目前淘宝一共有739家店铺出售乐高玩具。来自汕头市的店铺占据了42%,上海15%,广州13%,北京8%,深圳8%.

  • 卖家数与销售额树状图
卖家数与销售额树状图

嘉兴的卖家只有2个,但是得到了34%的市场份额(按销售额计算);上海的卖家数为108,市场份额23%,相对平衡;汕头是一个拥挤的市场,有314个卖家,但是总的市场份额只有13%。同样也说明汕头乐高类玩具产业发达,资源多销售门槛低;拥有几乎同样市场份额的北京,只有61个卖家。


嘉兴地区

单独看嘉兴,该地区的数据约等于乐高官方旗舰店一家的数据。

  • 不同价格区间的卖家所在地的交互图

注:此处应用了tableau的交互图。饼图是乐高各价格区间的商品数与总商品数的占比,条形图是该价格区间各地卖家数量

0~50元区间与城市交互图

50~100元区间与城市交互图

100~200元区间与城市交互图
200~300元区间与城市交互图

500~1000元区间与城市交互图

500~1000元区间与城市交互图

≥1000元区间与城市交互图

商品分布在200元以下的产品主要来自汕头,300元以上高价位产品主要集中在上海、北京和广州等大城市。前者应该就是国产平价积木玩具的生产地带。但是高端的乐高产品,北上广应该是货源优势地带。

3.2.2 对销售额TOP卖家店铺分析
  • 销售额TOP10卖家


    销售额TOP10卖家

    image.png

TOP10中乐高官方旗舰店、天猫国际进口超市、天猫超市、乐高玩具专卖店是B店,其余的是C店。
官方旗舰店的销售数据参考意义不大,而liji0904作为C店排在第三,值得探究。

  • liji0904产品结构


liji0904产品结构

产品覆盖各个价格区间,数量也比较均衡。

  • liji0904店销售结构


    liji9040各价位销售数据
liji0904店销售结构

100-200元的产品销量最高,500-1000元的产品是销售额最高的。可以看出这家店的引流主力就是100-200元的产品,然后靠300元以上的产品推动销售额。

  • 该店销量Top20及销售额Top20商品一览


    liji0904销量TOP20商品.png
liji0904销售额TOP20商品.png
  • liji0904店铺宝贝标题分析
df=pd.read_csv(r'D:\tableau\lego_taobao.csv')
title=df.groupby('shop_name').get_group('liji0904').goods_name.str.cat(sep='。')
#jieba分词
import jieba 
result_list=jieba.lcut(title)

#词频统计函数
def word_fre(jieba_list):
    list1=[i for i in jieba_list if len(i)>=2] 
      
    list_set=set(list1)
    
    list2=[]
    count_nums=[]

    for i in list_set:
        list2.append(i)
        count_nums.append(list1.count(i))
    
    dataFrame=pd.DataFrame({'word':list2,'num':count_nums})     
    return dataFrame

result=word_fre(result_list)
result.to_csv('C:\\Users\\Desktop\\liji0904_ciyun.xlsx')#导入tableau做词云图
liji0904词云图

全站搜索词云图

liji9040的宝贝标题基本都会用上“乐高”、“积木”、“玩具”、“拼装”、男孩或女孩和该商品名称及数字编码,一些宝贝还会用上“旗舰店”、“官网”。查看全站搜索大词,基本重合。

4、分析总结

按照制定的指标综合考量,售价≥1000级别市场是最理想的,其次是300-500元和500-1000元。除此以外的低端市场比较难做。
在低端市场,广东汕头是大多数卖家的根据地。300元以上的商品大多是上海北京广州的卖家的选择。存在即合理,货源可以依据这个去查找。
观察淘宝前三唯一的c店,能发现他就是典型的关注理想市场的卖家。而且这家店产品覆盖全面而且比较均衡,市场比较理想的高价位商品会稍微多一点。销售数据也印证了我们的第一条观点。他们的策略是100-200元的产品引流(价格越低,销量越高),然后靠300元以上的产品推动销售额(市场更大,而且竞争相对小)。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352