贝叶斯学习

1.  pr(h|D)   基于数据找到所有假设H集合中概率最高、可能性最大的假设h

2. 贝叶斯定理









4. 测试题

一机器在良好状态生产合格产品几率是 90%,在故障状态生产合格产品几率是 30%,机器良好的概率是 75%。若一日第一件产品是合格品,那么此日机器良好的概率是多少。

p(良好|合格) = p(合格|良好) * p(良好) / p(合格)

p(良好|合格) = 0.9 * 0.75 / p(合格)

p(合格) = 3*0.9+1*0.3 / 4 = 3/4 = 0.75

p(良好|合格) = 0.9 * 0.75 / 0.75 = 0.9


5. 加入似然比例的计算

https://www.zhihu.com/question/19725590


�E样本下良好与故障的比例 = 3/1 * 0.9/0.3 = 9:1  ,良好率为90%


3. 另一个测试题 udacity

一个人去看医生,医生给他做了检测,这个检测如果检测出阳性,准确率为98%(98%的可能性为真的阳性),如果检测出阴性,准确率是97%,而这个疾病在人类的发病率是0.8%,那么现在如果有一个人被机器检测出阳性,那么他真的患病的概率是多少?

也就是下边两个的比例:

p(得病|阳性) = p(得病) * p(阳性|得病) / p(阳性) = 0.008 * 0.98 / p(阳性)

p(没得病|阳性) =p(没得病) *p(阳性|没得病) / p(阳性) = 0.992 * 0.03 /p(阳性)

比例差不多是 没得病:得病 = 30:7

按似然比例的算法,没得病:得病 = 0.008 / 0.992 * 0.98/0.003 ,结果是一样的,但是有点绕。

所以题目应该翻译为:得病情况下,检测为阳性的比例98%;没得病情况下,检测为阴性的比例97%?


6. 版本空间

与已知数据集一致的所有假设的子集集合。�在9.6章节中有推理,结论是pr(h|d) = 1 / |VS|,前提是样本noise free,且要学习的概念在假设空间集合内。

http://blog.csdn.net/thither_shore/article/details/52311282


7. 噪声数据 9.7这节什么意思?

类似这样莫名其妙的题目,目的是什么,需要哪些数学知识能明白?还是单纯的翻译不好?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容