第三篇-数据分布

二项分布

  概念:二项分布是由伯努利提出的概念,指的是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。

公式:

二项分布公式

生活案例:产品抽检的二项分布应用,抽查5件产品,其中有2件为次品的概率  

多项分布

概念:多项分布是二项分布的推广,二项分布的试验结果只有两个,而多项分布的试验结果则多于两个。如果事件的结果有三个,则是三项分布;如果结果有五个,则是五项分布。与二项分布相同,多项分布也是一个概率分布族


多项分布公司

生活案列:足球比赛的结果有胜、平、负三种,根据历史战绩,我们可以得到每种结果的历史统计概率

泊松分布

概念:泊松概率分布考虑的是在连续时间或空间单位上发生随机事件次数的概率。通俗的解释为:基于过去某个随机事件在某段时间或某个空间内发生的平均次数,预测该随机事件在未来同样长的时间或同样大的空间内发生n次的概率


泊松公式

式中,n代表伯努利试验的次数;x代表n次试验中“成功”的次数;p代表每次试验“成功”的概率;q代表每次试验“失败”的概率。

生活案列:泊松分布经常被用于销量较低的商品库存控制,特别是价格昂贵、需求量不大的商品。例如,某家海鲜酒楼在过去一年的时间里,每月平均卖出 7 只龙虾,如果该餐厅z希望今后能有 95%的把握满足顾客的龙虾需求,需要存储多少只龙虾呢?像这一类问题就能用泊松概率分布来解决

指数分布

概念:指数分布描述的是两次随机事件发生的时间间隔的概率分布情况,这里的时间间隔指的是一次随机事件发生到下一次随机事件再发生的时间间隔


指数分布在概率密度函数

生活案例:指数分布的应用广泛。例如,某医院过去平均每10分钟出生一个婴儿,求接下来5分钟内有婴儿出生的概率;某公司的客服人员平均5分钟接一次电话,那么接下来2分钟内有电话打入的概率;某品牌的电脑平均10年出现一次重大事故,求该电脑5年内发生故障的概率等。

均方分布

概念:均匀概率分布是古典概率分布的连续形式,是指随机事件的可能结果是连续型数据变量,所有的连续型数据结果所对应的概率相等


均方密度概率函数


生活案例:使用均匀分布分析家具物流的送货时间;装一套家具的时间为25分钟到35 分钟,且组装时间服从均匀概率分布。求组装一组家具的组装时间在28分钟到30分钟之间的概率以及多于32分钟的概率

卡方分布

概念:若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

正太分布

概念:正态概率分布是所有概率分布中最重要的形式,因为它表明被测事物处在稳定的状态下,测量数据的波动是由偶然因素引起的,所以在实践中有着广泛的应用


正太分布公式

1、服从正态分布,经验法则指68.3%数据落在一倍标准偏差之内,95.4%数据落在二倍标准偏差之内,99.7%数据落在三倍标准偏差之内;

2、只有当连续型随机变量服从正态分布时,其Z变换才能转换为标准正态分布;

3、二项分布、泊松分布的正态近似

生活案例:使用正态分布分析研究生毕业论文的完成时间

beta (贝塔)  分布

概念:贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,在机器学习和数理统计学中有重要应用。在概率论中,贝塔分布,也称Β分布,是指一组定义在(0,1) 区间的连续概率分布。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容