python | 销售记录可视化

01 内容提要

本周我们利用python的matplotlib,针对性地练习数据可视化技能。

我们拿到一家公司的销售记录,共有1500条销售数据,现在我们对这张销售记录进行可视化分析吧,这是数据分析师的必经之路哦。

内容提要:

  • 条形图:各公司交易额
  • 多图:各公司交易额、订单数
  • 饼图:各公司交易额占比TOP10总额
  • 散点图:各公司订单数-交易额分布
  • 直方图:单笔订单交易额分布情况

那么我们开始吧!

02 数据处理

首先使用pd.read_excel读取数据,定义该数据表名为df,数据结构如下,这组数据记录了某公司2014年的交易情况:

  • account number: 账号
  • name: 公司名字,与账号有一一对应关系
  • sku: 商品货号
  • quantity: 购货量
  • unit price: 单位价格
  • ext price: 总价 = 购货量*单位价格
  • date: 日期

通过df.info()查看各字段总数,可以看到共有1500条数据。

数据清洗
#查看数据时发现,购货量有负数,将这些记录筛选出来,根据实际情况决定是否归为异常数据
df[df.quantity<0]
#由于不了解实际情况,目前暂时认为购货量负数为正常值(可从公司名name统计,看看是否是某几个公司出现的情况,是否是退货)
统计有交易记录的公司数量
len(df.name.unique()) #与之交易的公司数量,20个
筛选出交易额最高的10家公司
#将df按公司名name分组,对各组交易额ext price求和得到各公司总交易额,计数得到各公司总订单数
#为了不将name作为索引,使用reset_index重置索引
#使用sort_values()对指定列排序
top10=df.groupby('name')['ext price'].agg(['sum','count']).reset_index().sort_values(by='sum',ascending=False)[:10]
top10.rename(columns={'name':'Company','sum':'Sales','count':'Purchases'},inplace=True)
top10

得到如下数据表,下面我们将基于此表进行数据的可视化,展现交易额top10的公司情况。

03 数据可视化

条形图

查看top10公司交易额情况

#使用ggplot风格的作图:
plt.style.use('ggplot')

#barh绘制水平条形图;bar绘制垂直直方图
"""注意,条形图条数np.arange(10),要与top10.Sales数据数量一致,否则会报错-形状不匹(shape mismatch)"""
plt.barh(np.arange(10),top10.Sales,height=0.6)

#添加标题
plt.title('Top 10 Sales Company')
plt.xlabel('Total Revenue')
plt.ylabel('Company')

#修改纵坐标、横坐标刻度
plt.yticks(np.arange(10),top10.Company)
plt.xticks([0,20000,40000,60000,80000,100000,120000,140000],
          ['$0k','$20k','$40k','$60k','$80k','$100k','$120k','$140k'])

plt.show()

输出如下

浅析

  • 可以看到,交易额最高的公司是Kulas Inc和White-Trantow公司,达到了近14万美元。
  • 接下来可以从这两家公司订购的商品种类、以及各种类商品采购量入手,分析高交易额的原因,公司偏好-高交易额是因为买的种类多还是某类商品订购量大,同理可分析其他公司
  • 从订单数计算单笔订单交易额,分析客户订购偏好-大批量采购/少量订购
绘制多图

将多个图展现在同一画布中,便于进一步分析,以下仅做示例。

plt.style.use('ggplot')
#设置画布大小
fig=plt.figure(figsize=(10,10))

#加上图像大标题
fig.suptitle('Sales Analysis',fontsize=16,fontweight='bold')

#fig.add_subplot(x,y,z),表示将画布分为x行,y列,当前图像放在从左到右、从上到下的第z个位置

#添加第一个子图
ax1=fig.add_subplot(2,2,1)
plt.barh(np.arange(10),top10.Sales,height=0.5,tick_label=top10.Company)
plt.title('Revenue')

#加入平均销售额线  plt.axvline()表示添加垂直线axis vertical line
revenue_avg=top10.Sales.mean()
plt.axvline(x=revenue_avg,color='b',linestyle='--',linewidth=3)


#添加第二个子图
ax2=fig.add_subplot(222)
plt.barh(np.arange(10),top10.Purchases,height=0.5)
plt.title('Purchases')

#设置不显示y轴刻度
plt.yticks(visible=False)

#加入平均订单数线
Purchases_avg=top10.Purchases.mean()
plt.axvline(x=Purchases_avg,color='b',linestyle='--',linewidth=3)

输出如下

饼图

top10公司销售额占比

#plt.pie()绘制饼图
labels代表每个扇区的标签,
colors=['b','g'],设置扇区颜色
startangle代表起始位置角度
explode=(0.1,0,0,0,0,0,0,0,0,0)代表将第一个扇区拉出来0.1,作为突出显示
autopct='%1.1f%%',代表给出每个扇区的占比 ,精确到小数点后1位

plt.pie(top10.Sales,labels=top10.Company,
        colors=['r','y','b','g','c','r','y','b','g','c'],
        startangle=90,
        explode=(0.1,0,0,0,0,0,0,0,0,0),
        autopct='%1.1f%%')
plt.axis('equal')

输出如下

散点图

top10公司中,各公司销售额与订单数的关系,展示各公司交易习惯-偏好大订单还是小额订单。

plt.style.use('ggplot')
#scatter绘制散点图,s设置点大小
plt.scatter(x=top10.Purchases,y=top10.Sales,s=100)
plt.show()

输出如下

直方图

对于原始数据df中,每笔订单的交易额(ext price),统计单笔订单交易额分布情况。

#hist绘制直方图,bins设置区间个数
plt.hist(df['ext price'],bins=20,rwidth=0.8)

输出如下

可以看到,单笔订单交易额在200~600美元的订单最多,可以从一方面反映客户的下单偏好-小额订单。

当然,更有价值的分析应该下沉到各公司的单笔订单金额去分析,这里暂不做展开。

04 总结

以上可视化主要利用matplotlib,主要涉及到条形图barh bar,直方图hist,饼图pie,散点图scatter,多图fig.add_subplot。

作图代码千千万,要收集整理,用以致学。

希望对你有帮助~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容