统计分为两种,一种是学术统计研究,一种是商务的统计分析。
一. 统计研究
统计研究步骤的基本逻辑: 设计-收集-整理-检验-分析
1.设计 Design
选题-明确研究目的-提出假设-明确总体范围-确立观察指标-控制研究中的偏倚-给出具体的研究方案。
P值 P value
置信区间 Confidence interval
2.收集 Data collection
质量控制非常重要。基础数据的质量决定了统计结果。
连续变量 Continuous variable
分类变量 Categorical variable
单样本 Single sample
两样本 Two sample
3.整理
借助软件工具进行半自动花的整理。
抽样误差 Sampling error
标准误差 Standard error
4.参数估计与假设检验:
点估计与区间估计 Point Estimation and Interval Estimation
假设检验的基本原理与标准步骤 hypothesis test
t检验
卡方检验
5.分析 Analyse
如何选择正确的统计方法?
统计描述,了解样本情况。引入相应的统计描述指标:
频数统计 Frequency Table
集中趋势 Central Tendency 均数Mean
离散趋势 Dispersion Tendency 全距Range 变异系数
分布形状,是否对称,分布曲线形状,正负偏和左右偏。
分布特征,频数分布和正台分布,标准正太分布,二项分布,t分布
指标呈现方式:统计图与统计报表。统计推断,从样本信息外推到总体,获取解答 。
注意事项,相对数的应用中,分母不宜过小。几个总绿比较的时候要注意构成的差别,如果分母不同不可直接相加或平均。
6.错误与错误控制 Misuse
一类错误(I型错误)
二类错误(II型错误)
二.统计分析
步骤 统计分析可以分为5个步骤
1. 描述要分析的数据的性质
2. 研究基础群体的数据关系 ·
3. 创建一个模型,总结数据与基础群体的联系 ·
4. 证明(或否定)该模型的有效性 ·
5. 采用预测分析来预测将来的趋势
软件:SAS ,Python, Jupter, Pandas
Study road Map
第一阶段:数学基础,数学,高等数学,线性代数,概率论,数学建模;
第二阶段:计算机基础,编程,Python,工具库,R,网络爬虫;
第三阶段:机器学习 Machine learning;
第四阶段:数据挖掘 Data Mining;
第五阶段:深度学习,网络与框架.
其实我们能碰到的80%的问题,已经有人帮我们回答过了,答案在互联网上,都能够找得到,你只要搜索就好,剩下的20%,你再研究。往往很难的是思维结构,结构化体系花你搜集的知识。今天就是汇总了网络上关于统计步骤的知识点。会搜索可以提高学习效率。用baidu搜索google镜像,用wiki百科去看知识结构(https://www.wikipedia.org/),都是不错的选择。
希望通过结构化知识,提高学习效率,让你的工作时间更值钱,赚钱更高效!------------《 数据分析笔记》