本周继续《深入浅出统计学》P85-216
分散性:
均值(μ)、中位数、众数都不足以度量数据之间存在的差异。于是出现了“距”的概念:
全距(极差)=P上-P下;
四分位距=P上四分位-P下四分位;
第n数的百分位距Pk=k(n/100)
接着出现“箱形图”直观表现:全距、四分位距、中位数相对位置。(图略)。
变异性
方差:σ*σ=[∑(x-μ)*(x-μ)]/n
标准差:σ
标准分:Z=(x-μ)/σ
基本概率:P(A)=n(A)/n(S)(数数的我也略)
大名鼎鼎的贝叶斯公式
我是这样理解的:条件B成立的情况下事件A的概率→推导出→条件A成立时事件B发生的概率。最简单的预测神器啊,这两年不知道听了多少次但是头脑一片空白,早就记不起来原来工程数学讲过的。
基本公式:P(A∩B)=P(B)P(A│B)
P(B)=P(A∩B)+P(A`∩B)
贝叶斯公式:P(A│B)=P(A)P(B│A)/[ P(A)P(B│A)+P(A`)P(B│A`)]
在实际当中非常有用。比如,互联网中过滤垃圾电子邮件,医学实验中药效、患病概率。
其他:独立事件、互斥事件、相关事件概念区别、概率树应用
期望:E(X)=∑xP(X=x)。
概率分布方差:Var(X)=E【(x-μ)(x-μ)】
=∑【(x-μ)(x-μ)】P(X=x)