本周内容总结
本周主要的重点内容是数据可视化的部分:
· Matplotlib
子图subplots
中文显示
重温了 基本的折线图、条形图(堆积条形图)、直方图、散点图、箱线图(boxplot)的绘制
· 图形注释 annotate
xy= 箭头的指向;xytext,箭头的其实位置和注释的位置,arrowprops可以设置箭头的形状,颜色等等
· Seaborn的连续和不连续数据可选图形
连续数据绘图:jointplot 组合图、pairplot描述多个数据两两之间关系的图
离散数据绘图:barplot 条形图,stripplot/ swampplot 散点图(观察点集中的位置),lmplot线性回归图
· pyechart 图形
pyechart是基于百度Echart实现的可交互图形。官网有很多不同的图形例子可以参照。上手相对来说比较快
主要的设置方式是.add_, set_global_opts,set_series_opts以及X轴和Y轴的设置
使用Pyechart制作了简单的疫情地图。之前用Tableau也做过国内疫情地图,不过Tableau的时间轴不太好设置,变化比较慢,好处是简单拖动即可,pyechart可以设置play_interval,从而更改切换速度。
pyechart地图 : https://mp.weixin.qq.com/s/YezQm0g77jfmWkO-SHlRWQ
· 重温数据化管理chapter1、2、3
chapter1 主要数据化对管理的意义、以及数据分析的整体流程
chapter2 主角是权重指数;权重指数需要就近一整年的数据,去掉特殊节假日和促销日,分成周一/周二……周日,取出平均值最小的星期N使之权重为一,从而计算周权重,月权重和确定月指标、周指标甚至日指标。将指标追踪细化到日。初步了解 黄氏曲线和平均权重销售额,可以用来分析突发事件对于销售额的营销程度;
chapter3 人货场 营运分析的一部分;杜邦分析图和促销前分析、常用的促销形式、促销后总结分析
人:围绕员工(新老员工,定边满足率、业务能力、平均接待时长、平均成交时长、投诉等)和顾客的相应指标(主要是会员指标)
货的部分单独成章(进销存)
场的部分涉及店铺的销售额指标、追踪指标、分析指标、效率指标、竞争情况、促销指标等等,还包括渠道的分析和占比;非常细化
短板:
业务知识
统计学知识
PowerBi(之前练过Tableau)
SQL和其他工具的联用以及SQL 本身关联子查询、设置变量计算排名需要多看多练!
Python的自定义函数/对类的认识/If的多重嵌套/apply的使用 以上这些的联用!
下周重点:
SQL的不断强化刷题、统计学知识补课、业务知识——数据化管理和多看分析报告 以及数据蛙业务知识、powerBi入门