Adventure销售数据分析

一、项目介绍:
1.1、公司业务简介:

Adventure Works Cycle主要生产和销售金属和复合材料自行车,并在国内各个市场销售。公司前期通过分销商模式达成收入目标。在2019年为进一步扩大市场和销售额,实行利用公司网站进行销售的新模式。

1.2、分析背景与目的:

2019年12月需向领导汇报2019年11月自行车销售情况。通过撰写数据分析报告从整体上,掌握整个公司的自行车销售状况、销售走势的变化;从细节上,通过多维度分析,为日常运营提供数据支持,并制定相应销售策略,调整产品结构。

二、数据字典与维度
2.1、数据字典:
2.1数据字典.png

通过python工具对ODS基础层数据进行加工,并加载到DW汇总层

2.2、关键数据维度:
2.2数据维度
三、分析思路与流程
3.1、分析思路:
3.1分析思路.png
3.2、主要分析流程:
数据分析主要流程
3.2.1导入模块并读取数据

(1)导入模块

import numpy as np
import pandas as pd
import pymysql
pymysql.install_as_MySQLdb()
from sqlalchemy import create_engine

(2)连接mysql获取表格信息

#读取dw层数据
#创建数据库引擎
engine =create_engine('mysql://fgdata:fg123@106.13.128.00:3306/adventure_ods?charset=gbk')
datafrog =engine
gather_customer_order=pd.read_sql_query('select * from dw_customer_order',con=datafrog)
#读取ods层数据
#创建数据库引擎
engine = create_engine('mysql://fgdata:fg123@106.13.128.00:3306/adventure_ods?charset=gbk')
datafrog=engine
df_CUSTOMER = pd.read_sql_query("select customer_key,birth_date,gender,marital_status from ods_customer where create_date < '2019-12-1'",con = datafrog)
3.2.2数据概况分析
查看数据源类型:
gather_customer_order.info()
数据概况分析1

合计227263条数据,不存在缺失值数据。

查看数据源类型:
df.CUSTOMER.info()
数据概况分析2

合计1062585条数据,不存在缺失值数据。

3.2.3单变量分析(关键数据处理)

(1)利用create_date字段增加create_year_month月份字段,供月维度分析时使用

gather_customer_order['create_date'] =pd.to_datetime(gather_customer_order['create_date'])
gather_customer_order['create_year_month']=gather_customer_order['create_date'].astype('str').str[0:7]

(2)groupby()分组聚合每月销量与销售额,重置索引并降序

grouped_month=gather_customer_order.groupby('create_year_month')
overall_sales_performance =grouped_month[['order_num','sum_amount']].agg({'order_num':sum,'sum_amount':sum})
overall_sales_performance =overall_sales_performance.reset_index()
overall_sales_performance =overall_sales_performance.sort_values(by='create_year_month',ascending =False)

(3)diff()函数实现数值型变量多月销售额环比计算

#新增一列sum_amount_diff,实现数值型变量多月自行车销售金额环比
#求每月自行车销售金额环比
sum_amount_diff = list((overall_sales_performance.sum_amount.diff()/overall_sales_performance.sum_amount)-1)
sum_amount_diff.pop(0)
sum_amount_diff.append(0)
#将环比转化为DataFrame并合并
sum_amount_diff= pd.DataFrame(sum_amount_diff)
overall_sales_performance= pd.concat([overall_sales_performance,pd.DataFrame(sum_amount_diff)],axis=1)
#改列名,否则显示列名是0
overall_sales_performance =overall_sales_performance.rename(columns ={0:'sum_amount_diff'})
overall_sales_performance.head()

(4)pct_change()函数实现分类型变量单月销量环比计算

#不同区域10月11月的环比,实现分类变量单月销量环比计算
#1、获得去重区域的列表region_list
region_list=list(gather_customer_order_10_11_group.chinese_territory.unique())
#2、利用for循环区域列表,结合loc定位符合区域,利用pct_change()函数实现环比效果,形成新的Series
order_x =pd.Series([])
amount_x =pd.Series([])
for i in region_list:
    a =gather_customer_order_10_11_group.loc[gather_customer_order_10_11_group['chinese_territory']==i]['order_num'].pct_change()
    b=gather_customer_order_10_11_group.loc[gather_customer_order_10_11_group['chinese_territory']==i]['sum_amount'].pct_change()
    order_x=order_x.append(a)
    amount_x = amount_x.append(b)
#3、赋予新的Series的变量名
gather_customer_order_10_11_group['order_diff']=order_x
gather_customer_order_10_11_group['amount_diff']=amount_x
#4、由0替换NaN值
gather_customer_order_10_11_group['order_diff']=gather_customer_order_10_11_group['order_diff'].fillna(value =0)
gather_customer_order_10_11_group['amount_diff']=gather_customer_order_10_11_group['amount_diff'].fillna(value =0)
gather_customer_order_10_11_group.head()


(5)cut()函数实现用户年龄分层

#利用customer_age字段,进行年龄分层,划分层次为"30-34","35-39","40-44","45-49","50-54","55-59","60-64"
bins =[30,34,39,44,49,54,59,64]
group_names=["30-34","35-39","40-44","45-49","50-54","55-59","60-64"]
sales_customer_order_11['age_level']= pd.cut(sales_customer_order_11['customer_age'],bins=bins,labels =group_names)
3.2.4可视化分析(利用PowerBI作图)

(1)整体销售情况分析

2019年1月至11月销量走势图

由图可知,近11个月,11月自行车销量最多,为3316辆;较10月增长7.1%
2019年1月至11月销售金额走势图

由上图可知,近11个月,11月自行车销售金额最高,为6190万元;较10月增长8.7%
因此,从整体来看,自行车的销售金额与销售数量趋势一致,均在11月达到顶峰。
(2)地域销售情况分析
2019年11月各区域销售量环比增速图

由上图可知,11月华东地区自行车销量在8个地区中最多,为871辆,远高于其他地区销量,销售主场区域;较10月,华南地区增速为15%,增速最快
2019年11月各城市销售量环比增速图

Top10城市市场份额占比图

由上图表可知,在10月与11月自行车销售市场中,Top10城市市场份额总占比13.48%,其中尽管北京市上海市市场份额占比排名前列,但相较于其他城市份额占比不超于1.5%,可见自行车销量在各城市间销量分布均匀。此外,郑州市11月份环比增速急剧,达到48%,存在一定的潜力,可考虑提前备货给郑州市。
(注:城市市场份额=城市销售量/总销售量)
(3)产品销量情况分析

自行车类别销量分布图.png

自行车类别销量情况表

由上可知,从2019年1-11月份,公路自行车在各产品类别中占比最高,且每月占比均超过50%11月销量1-11月累计销量分别为1788辆18182辆远超山地自行车和公路自行车,是自行车类别中的主打产品

公路自行车销量分布图

公路自行车销量情况表

由上图表可知,2019年1-11月份Road-250 RedRoad-750 Black 在公路自行车中占比较高,其中Road-250 Red11月份中销量占比最高,约为19.57%,且较10月增速14.19%,增速最快。此外,在11月公路自行车中,除Road-350-W Yellow外,其他型号的自行车环比都呈现上升趋势。

山地自行车销量分布图

山路自行车销量情况表

由上图表可知,2019年1-11月份Mountain-200 BlackMountain-200 Sliver 在山地自行车中占比较高,其中Mountain-200 Sliver11月份中销量占比最高,约为36.31%Mountain-500 Sliver 较10月增速19.51%,增速最快。此外,在11月公路自行车中,除Mountain-200 Black外,其他型号的自行车环比都呈现上升趋势。
旅游自行车销量分布图

旅游自行车销量情况表

由上图表可知,2019年1-11月份Touring-1000 BlueMountain-1000 Yellow 在旅游自行车中占比较高,其中Touring-1000 Blue11月份中销量占比最高,约为32.67%Mountain-1000 Yellow 较10月增速28.43%,增速最快。此外,在11月旅游自行车中,除Touring-2000 BlueTouring-3000 Blue外,其他型号的自行车环比都呈现上升趋势。
(4)热销产品分析
11月Top10产品销量走势图

11月Top10产品销量表.png

由上图表可知,2019年11月1,型号为Road—150 Red、Road—550-W Yellow、Mountan-200 Sliver、Mountan-200 Black销量较高,其中Road—150 Red销量最高,较10月增长25.24%
11月Top10产品销量增速走势图

11月Top10产品销量增速表

由上图表可知,2019年11月,型号为Touring—1000 Blue、Road—250 Red、Road—150 Red、Road-550-W Yellow增速较快,其中Touring—1000 Blue增速最快,较10月增长47.06%
(5)用户行为分析
2019年11月全国用户网络年龄分布图

用户不同年龄段产品消费结构图

由上图可知,年龄段35-39岁消费人数占比最高,为29%;之后随着年龄的增长,占比逐渐下降。针对年龄(大于30岁)的消费群分析,发现购买公路自行车占比最大山地自行车占比最小
全国男女消费比例图

男女产品消费结构图

由上图表可知,全国女性购买自行车人数于男性,多约10%。通过男女消费群分析,发现用户购买公路自行车占比最高,购买旅游自行车占比最少

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,284评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,115评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,614评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,671评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,699评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,562评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,309评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,223评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,668评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,859评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,981评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,705评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,310评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,904评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,023评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,146评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,933评论 2 355