1. pr(h|D) 基于数据找到所有假设H集合中概率最高、可能性最大的假设h
2. 贝叶斯定理
4. 测试题
一机器在良好状态生产合格产品几率是 90%,在故障状态生产合格产品几率是 30%,机器良好的概率是 75%。若一日第一件产品是合格品,那么此日机器良好的概率是多少。
p(良好|合格) = p(合格|良好) * p(良好) / p(合格)
p(良好|合格) = 0.9 * 0.75 / p(合格)
p(合格) = 3*0.9+1*0.3 / 4 = 3/4 = 0.75
p(良好|合格) = 0.9 * 0.75 / 0.75 = 0.9
5. 加入似然比例的计算
https://www.zhihu.com/question/19725590
�E样本下良好与故障的比例 = 3/1 * 0.9/0.3 = 9:1 ,良好率为90%
3. 另一个测试题 udacity
一个人去看医生,医生给他做了检测,这个检测如果检测出阳性,准确率为98%(98%的可能性为真的阳性),如果检测出阴性,准确率是97%,而这个疾病在人类的发病率是0.8%,那么现在如果有一个人被机器检测出阳性,那么他真的患病的概率是多少?
也就是下边两个的比例:
p(得病|阳性) = p(得病) * p(阳性|得病) / p(阳性) = 0.008 * 0.98 / p(阳性)
p(没得病|阳性) =p(没得病) *p(阳性|没得病) / p(阳性) = 0.992 * 0.03 /p(阳性)
比例差不多是 没得病:得病 = 30:7
按似然比例的算法,没得病:得病 = 0.008 / 0.992 * 0.98/0.003 ,结果是一样的,但是有点绕。
所以题目应该翻译为:得病情况下,检测为阳性的比例98%;没得病情况下,检测为阴性的比例97%?
6. 版本空间
与已知数据集一致的所有假设的子集集合。�在9.6章节中有推理,结论是pr(h|d) = 1 / |VS|,前提是样本noise free,且要学习的概念在假设空间集合内。
http://blog.csdn.net/thither_shore/article/details/52311282
7. 噪声数据 9.7这节什么意思?
类似这样莫名其妙的题目,目的是什么,需要哪些数学知识能明白?还是单纯的翻译不好?