数据分析课程大纲
1、数据分析入门
初识数据分析:
什么是数据分析师?
数据分析师职业方向
2、数据分析常用Excel公式
Excel常用公式与函数:
数据清洗类
关联匹配类
逻辑运算类
计算统计类
时间序列类
Excel隐藏函数
Excel常见问题及解决方案
Excel日产工作使用技巧
Excel实战项目:
互联网金融行业常用指标分析
互联网金融行业充值返现活动效果分析
某教育机构财务周报分析
3、数据多维度、快速分析:数据透视表
Excel数据透视表
如何使用透视表
常用功能:报表布局、更改计算方式、套用样式、切片器及计算字段等
Excel数据透视表实战:
实战:Excel数据透视表分析某教育公司招生情况
4、数据可视化:经典数据图表
Excel经典数据图表:
柱形图、条形图、折线图、饼图
美化图表
漏斗图
XY散点图、面积图、组合图
Excel动态作图:
函数OFFSET
自定义名称动态作图
各种控件(单选、多选、组合框、滚动条、双控件)动态作图
Excel数据图表实战:
实战:互联网金融项目动态作图
5、学会跟数据库打交道:MySQL
MySQL数据分析:
数据库介绍及安装
MySQL安装
使用Workbench连接MySQL
数据库操作
数据表操作
常用查询语句
导入导出
MySQL实战:
实战:电商销售数据综合查询
6、概率统计及SPSS
概率论:
概率定义、性质
随机变量及其分布
贝叶斯公式
条件概率
描述性统计分析:
统计学基础概念
集中趋势的度量
离散程度的度量
偏态与峰度的度量
正态分布、t分布、卡方分布、F分布等
数据标准化
实战:Excel绘制标准正态分布概率密度曲线
参数估计:
参数估计的基本原理与置信区间
点估计
参数估计的基本原理与置信区间
一个总体参数的区间估计
两个总体参数的区间估计
练习:参数估计经典题目训练
假设检验:
假设检验的基本原理
利用P值进行决策
一个总体参数的检验
两个总体参数的检验
练习:假设检验经典题目训练
方差分析:
方差分析的基本问题
单因素方差分析
双因素方差分析
实战:用Excel进行有交互作用的双因素方差分析
SPS介绍及安装
利用SPSS做方差分析
线性回归:
变量间关系的度量
一元线性回归
利用回归方程进行估计和预测
残差分析
多元线性回归模型
回归方程拟合优度
多重共线性
利用回归方程进行估计和预测
变量选择与逐步回归
实战:利用回归分析预测某金融平台交易量
利用SPSS做回归分析
带有虚拟变量(哑变量)的线性回归分析
时间序列:
时间序列的概念和种类
时间序列的描述性分析
时间序列预测的程序
时间序列预测的方法
实战:用Excel预测某水产公司加工量
聚类分析:
聚类分析的基本原理
系统聚类
K-均值聚类
实战:利用SPSS对投资渠道进行聚类分析
因子分析及主成分分析:
主成分分析
因子分析
实战:利用SPSS对某金融在线平台的投资渠道进行因子分析
7、数据分析进阶技能:Excel VBA
Excel VBA【选学】从工资条说起:
录制宏
Excel VBA编程环境——VBE介绍
Excel对象
Excel基础语法
实战:某教育机构非学历项目返款表处理
8、实战案例汇总
1、互联网金融行业常用指标分析 :
构造辅助列:求出注册年份、首投距注册天数差、用户月均投资金额及用户层级等
分析维度:年份、年龄、产品、转化周期、城市、渠道及层级等
2、互联网金融行业充值返现活动效果分析 :
问题:某互金平台3月进行了充值返现活动,需要对活动效果进行分析及评估。
分析角度1:描述性分析&整体投资业绩带动
分析角度2:人群结构的带动
3、互联网平台用户精细化运营:
方法论
以RFM模型为基础的聚类测试
聚类过程、聚类结果呈现
主要类别用户分析
4、互联网平台充值返现活动分析:
用户的投资数据表,近8万条数据
流量:活跃用户拉伸
投资人数:
(1)老客复投人数比,新客拉新情况
(2)参与活动人数情况
投资力度:
(1)老客投资力度,新客投资力度
(2)投资结构影响
资金流向:回款复投率,新注入资金情况
成本:活动成本,费效比
5、实战:电商销售数据综合查询
模拟了某电商平台的数据库:订单表、退货记录表及区域经理表
从10+个角度进行分析,举例如下:
用一条SQL语句,查询出每个月的销售额都大于1 万元的城市
用一条SQL语句,查询总销售(销售数量)大于3000000的地区经理
用一条SQL语句,查询2017年5月到10月的订单,按照月份升序排序,月份相同的按照销售金额降序排序
6、实战:某教育机构非学历项目返款表处理
需求分析
批量新建工作表
批量对数据分类
批量将工作表保存为新工作簿