大数据入门篇-朝阳医院2016年销售数据分析

朝阳医院2016年销售数据分析

本关学习内容:R语言第三章(知识点链接https://zhuanlan.zhihu.com/p/28610253)和第四章(知识点链接https://zhuanlan.zhihu.com/p/28610422),简单的数据处理和分析

实践项目:根据朝阳医院2016年销售数据.xlsx分析月均消费次数,月均消费金额,客单价,消费趋势。

实践项目的:学习和使用简单的数据处理和分析,巩固和实践所学的内容,加深理解简单处理数据处理和分析的过程。

做此项目的大致流程:读取excel数据(选用openxlsx来读取)->数据预处理->数据分析;其中数据预处理包括了列名重命名,删除缺失数据,处理日期,数据类型转换,数据排序等相关知识。

下面我们就来做此项目吧!

朝阳医院2016年销售数据.xlsx部分内容如下:

一:读取excel数据

1.下载安装openxlsx包和stringr包(R语言的字符串处理包)

2.读取excel数据

二:数据预处理

列名重命名后:

三:数据分析:

业务指标1:月均消费次数

月消费次数=消费的总次数/月数

注意:同一天同一个人购买所有消费次数当算作消费一次。

本例子以社保卡号和消费时间为切入点

结果如下:

业务指标2:月均消费金额

月均消费金额=总消费金额/月份数


业务指标3:客单价pct(per customer transaction)

客单价=总消费金额/总消费次数

业务指标4:消费曲线图

本关心得:多敲代码,多练习,多做项目,才会让基础更扎实!

                                                                                                                              十三西游记(公众号十三西游记) 

                                                                                                                                                     2017/08/18记

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容