大纲
内容和意义
概率的概念:离散,连续的值的概率
例子1:每个盒子至多一个球的概率
概率公式:常见公司,贝叶斯示例
常见概率分布-离散型
-
常见概率分布-连续型
Q:概率和机器学习到底关系多大呢?
A: 噪声的分布经常都是正态分布;
指数分布是一般线性回归的分布的主要形式;
泊松分布可以用来模拟以时间序列发送的事件,具有无记忆性;
1.概率的概念
概率:P(x)∈[0,1]
- X为离散值,则P(X=X
0
)表示X0
发生的概率 - X为连续值,则P(X=X
0
)表示X0
发生的概率密度
累积分布函数:F(a)=P(x<=X0
)
- F(X
0
)是单增的 - min(F(X
0
))=0 , max(F(X0
))=1
遇到一个函数,若是单增,且值域为[0,1]则该函数可以看做是概率累积函数
2. 概率求解示例
解决问题的基本套路:(有效事件数量)/(总事件数量)
n个球放N个盒子,n<=N,求每个盒子最多一个球的概率
引出组合的概念
n个商品分为k组,每组个数分别是n
1
,n2
...nk
,则不同分组方法
一共有n!/ (n1
!n2
!...nk
!)种方法
简化上述问题,n个商品分为2组,第一组m个,第二组n-m个,则分组方法
一共有n!/ (m!(n-m)!)种方法
这就是n个里面选m个,即组合数C(m,n)
3.概率公式
手动版贝叶斯
8个枪,5个好的3坏的,好枪命中率0.8,坏枪0.3。现在随机拿一把,射击中靶。求是好枪的概率。
已知条件整合
- P(好枪)=5/8 , P(坏枪)=3/8
- P(中 | 好枪)=0.8,P(不中 | 好枪)=0.2
-
P(中 | 坏枪)=0.3,P(不中 | 坏枪)=0.7
求解问题:** P(好枪 | 中)=?**
贝叶斯公式
先验概率 P(θ):系统本身事件θ发生概率
后验概率 P(θ|x):在数据x的条件下,事件θ发生概率
似然函数 P(x|θ):给定参数θ的概率分布
4.常见概率分布-离散型
目录
- 0-1分布
- 几何分布
- 超几何分布
- 多项分布
- 泊松分布
0-1分布
几何分布
超几何分布
贝努利分布/二项分布
多项分布
泊松分布
泊松分布补充说明
一个随机事件,以固定平均瞬时速率随机且独立出现,呢么这个事件在单位时间内出现次数就近似服从泊松分布
- 某一服务设施,一定时间内到达的人数
- 电话交换机接到的呼叫次数
- 汽车站台的候客人数
- 机器出现故障数
- 自然灾害发生次数
- 一个产品的缺陷数
- 单位分区细菌分布数
- 放射性物质单位时间发出粒子数
5.常见概率分布-连续型
目录
- 均匀分布
- 指数分布
- 正态分布