贝叶斯学习

1. pr(h|D) 基于数据找到所有假设H集合中概率最高、可能性最大的假设h

2. 贝叶斯定理

4. 测试题

一机器在良好状态生产合格产品几率是 90%，在故障状态生产合格产品几率是 30%，机器良好的概率是 75%。若一日第一件产品是合格品，那么此日机器良好的概率是多少。

p(良好|合格) = p(合格|良好) * p(良好) / p(合格)

p(良好|合格) = 0.9 * 0.75 / p(合格)

p(合格) = 3*0.9+1*0.3 / 4 = 3/4 = 0.75

p(良好|合格) = 0.9 * 0.75 / 0.75 = 0.9

5. 加入似然比例的计算

https://www.zhihu.com/question/19725590

�E样本下良好与故障的比例 = 3/1 * 0.9/0.3 = 9:1 ，良好率为90%

3. 另一个测试题 udacity

一个人去看医生，医生给他做了检测，这个检测如果检测出阳性，准确率为98%（98%的可能性为真的阳性），如果检测出阴性，准确率是97%，而这个疾病在人类的发病率是0.8%，那么现在如果有一个人被机器检测出阳性，那么他真的患病的概率是多少？

也就是下边两个的比例：

p(得病|阳性) = p(得病) * p(阳性|得病) / p(阳性) = 0.008 * 0.98 / p(阳性)

p(没得病|阳性) =p(没得病) *p(阳性|没得病) / p(阳性) = 0.992 * 0.03 /p(阳性)

比例差不多是没得病：得病 = 30：7

按似然比例的算法，没得病：得病 = 0.008 / 0.992 * 0.98/0.003 ，结果是一样的，但是有点绕。

所以题目应该翻译为：得病情况下，检测为阳性的比例98%；没得病情况下，检测为阴性的比例97%？

6. 版本空间

与已知数据集一致的所有假设的子集集合。�在9.6章节中有推理，结论是pr(h|d) = 1 / |VS|，前提是样本noise free，且要学习的概念在假设空间集合内。

http://blog.csdn.net/thither_shore/article/details/52311282

7. 噪声数据 9.7这节什么意思？

类似这样莫名其妙的题目，目的是什么，需要哪些数学知识能明白？还是单纯的翻译不好？

最后编辑于：2017.12.11 11:19:45

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。