登录注册写文章

统计学习方法4.2-5.2笔记—22.7.25

统计学习方法4.2-5.2笔记—22.7.25

4.2 朴素贝叶斯法的参数估计

4.2.1 极大似然估计

下面两个公式就是对应的极大似然估计

实例1：

下面概率密度函数中，当X取1时就是β，当X取0时就是1-β

此处使用了遍历的方法，但当试验次数多或者集合包含元素多时就十分不便
针对这种情况，就要用下面的方法进行计算

这不就是多项式求极值么。。。

实例2：运用新的计算方式求：

δ表示方差，用来度量一个数据距离均值的波动情况；而σ表示标准差；μ取值无穷多，所以无法遍历，只能用上面的计算数值（先求对数来对函数进行简化再求偏导）得到下图

下边的μ^,δ即为具体的解析解

得不到解析解的原因：

1.虽然函数可微，但是解不出具体表达式；
2.函数不存在偏导数。
在这种情况下如何求解： ~~摆烂吧~~
迭代：

给定参数初始值β0，设定目标函数Q并带入β0，根据结论对参数进行修正并如此循环直到得到最优参数β^

各种方法：

遍历：先找好参数空间H，然后都带入似然函数中并找最大值（实例1）；
解析解： 当H十分巨大时，就可以用此方法，用高数来求解；
迭代法： 若无法求出解析解，则可用迭代法求出数值解（趋近真实值的近似解决方法）；

4.2.2 学习与分类算法

解析：

模型所使用的方法就是极大似然法来进行估计；
此时X的具体值都已知，即可计算对应的先验/条件概率，进而计算 后验概率 也就是x属于每个类的概率，进而求最大的概率以确定X的类

实例讲解：

①计算先验概率（即Y=1和Y=-1的概率，这题可以数出来），条件概率（即Y=±1时，X取值概率，也可以数）
②计算后验概率（分子）
③求出最大值，即所属类

4.2.3 贝叶斯估计

原因：使用极大似然估计会出现概率为0的情况（要避免），而这会影响到后验概率的计算结果，导致分类产生偏差；
估计方法：

不难看出，就是在极大似然的基础性上加了个λ，进而避免的概率为0的出现。分母的K/Sjλ是为了保证所有概率求和为1.

问题:
1.为啥叫贝叶斯估计?

假设要判断θ,那么其主观判断(即先验概率)就是P(θ),然后通过样本信息来进行矫正,并得到调整因子(条件概率)P(y1,....,yn|θ);最后得到后验概率P(θ|y1,....,yn)并通过其最大化来得到θ值。其本质还是 贝叶斯思维

Y对应随机变量而θ对应于参数，右上角为θ不同情况下P(Y)的计算方式；先验概率的计算公式就是Beta公式，其中第一项的分式为一个常量，在计算后验概率时可以忽略不计。

计算后验概率：

第二步到第三步就是对θ求导并求出极大值点，下图为求解结果

实例2：

均匀分布图像：

用相同方法求解得

不难看出，这里就是极大似然估计，即λ=0。因为均匀分布是一种 无信息 的分布，使得贝叶斯方法变成了概率方法。

综上所述，贝叶斯估计不仅考虑了数据本身的信息，还综合考虑了对应关系（分布函数，比如Beta和均匀分布）的信息，因此比起极大似然估计更加严谨？
2.平滑思想是?

贝叶斯估计将参数标记为θk，右边分子的求和标记为Nk，那么得到了下面的公式。移项后第一项为0则θ=Nk/N,即极大似然；第二项为0则θ=1/N,即先验概率
——>贝叶斯估计就是极大似然估计与先验概率的组合
与正则化相同，加入个λ (kθk-1)是防止出现过拟合，即不能只看样本，要有个对模型的假设，这就是平滑（？不如吃德芙）；
当λ=1且N->∞时，算式是趋于Nk/N的，所以此时1和K就没啥影响了。

实例讲解：

这里都用贝叶斯估计，黄标为做题顺序

五、决策树

定义： 描述对实例进行分类（目的）的 树形结构(即模型)
实际：决策树可以看作一堆if-then规则的集合

每个叶节点都对应一条规则，由下图可知

每个叶节点（类）可能对应多条路径，但是每个实例只对应一条路径

此规则的性质：互斥（不同规则间无交集）且完备（分叉合在一起为合集）

构建决策树：

第一步是将N个样本放入模型；第二步是选出样本中的最优特征值并进行分割‘
然后的看文字。
最优的定义找到一个将训练集中大部分的数据正确分类的模型即可，因为要对拟合与泛化能力进行一个平衡

5.1.3 决策树与条件概率分布

对于决策树来说

X是给定特征，Y是类；有多少个条件概率分布就对应多少个决策树

这个特征空间的划分条件

正负类划分依据：

将上面的平面扩为立体

对于1，3的区域而言，由于其概率>0.5所以其归为正类；而区域2P<0.5所以归为负类；
当X的类有多个时，只需看在X=c情况下每个类的条件概率，取大的那个作为其对应类

5.1.4 决策树学习

实例：
问题：1.根据同个训练数据集可以构造出多少个决策树；2.构造过程中以哪个特征作为首选，二选…3.当出现一个十分复杂的决策树时怎么办。
目标：
如何实现：

剪枝分为：预剪枝（果农修建果树不要让其长太高，在成熟前干）以及后剪枝（为树修剪特定形状，成熟后干）,这两个知识后面会再学到的

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

统计学习方法4.2-5.1 笔记
4.2 朴素贝叶斯：因何而朴素是一种分类方法，是贝叶斯定理 + 特征条件独立假设（使贝叶斯思维变为朴素贝叶斯） ...
千容安阅读 747评论 0赞 1
《统计学习方法》读书笔记
本文总结了《统计学习方法》（李航）中的一些机器学习方法，组织目录如下：【第1章】统计学习方法概论【第2章】感...
牛奶芝麻阅读 4,609评论 0赞 13

统计学习方法(一)——统计学习方法概论
文章作者：Tyan博客：noahsnail.com | CSDN | 简书 1. 统计学习方法概论本文是统计学习...
SnailTyan阅读 3,502评论 0赞 7
《统计学习方法》第 4 章“朴素贝叶斯法”学习笔记
概率有向图模型朴素贝叶斯也是最简单的概率有向图模型。生成模型与判别模型朴素贝叶斯方法实际上学习到的是生成数据...
李威威阅读 3,162评论 0赞 7
机器学习-统计学习方法算法笔记
监督学习感知机--二类分类的线性分类模型输出1和-1f(x)=sign(wx+b)学习策略：损失函数为误分类点...
kate2020阅读 288评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文