第二章 Misleading of the Training Set

在模型学习学习中,采用参数\epsilon 去衡量该假设h loss的优秀程度。

一般认为L_{(D,f)}(h_S)>\epsilon 时h为一个失败假设,一个训练集中,假设一个分布上界,即有m个样本将会导致学习器的失败的分布:

导致学习器失败的样本分布上界
假设集中的会学习失败的假设的集合
导致对学习器误导的样本

上式简单来说,就是说存在着一些失败假设,能够使得在真实情况下不应该被纳入正确样本的集合作为证明这些失败假设正确的样本,使得本该失败的该假设loss为0。

也就是说,训练集中的所有的错误样本,都属于能导致对学习器误导样本集M。

递推后得上式
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容