第三章 PAC leaning 'Why machine can learning'

在第二章里我们学到了有限假设集

回顾:

经验风险:Ls代表了在假设为h的情况下损失的表达式


可以选择使得经验风险最小化的假设,作为选择的假设

当H是有限集的时候,模型不会有过拟合的风险,并且如果ERM是在这个有限集中被提供了大量数据的话,可以认为最后得到的假设是一个概率近似准确的假设(PAC(Probably Approximately Correct))


PAC learninability 的定义:

\exists m_h : (0,1)^2 \rightarrow N以及一个具有如下条件的学习算法:\forall \epsilon,\delta \in  (0,1)\,  and\;  for\,every\,\mathcal{D\,} over\mathcal{X\,},and \,for \, every\,label\,function\;f:\mathcal{X}\rightarrow \,\{0,1\}

如果训练过程满足以上\mathcal{H,D,f},即样本采样自分布\mathcal{D},真正的映射关系是\mathcal{f},那么最后预估出来的假设h以至少1-\delta的概率使得L_{(D,f)}(h)<\epsilon

这个定义中,\epsilon衡量了最后学习出来的h有多接近f,即h的准确度。\delta衡量了h接近\epsilon的置信度。实际上,因为尽管训练集可以采样再多来自真实分布的样本,但毕竟不能用这些大量的数据去完全代表真实的分布,那么采用这个训练集去训练或多或少会有一些偏差,所以上面的两个参数,在实际训练中都是不可避免的会遇见的。而\epsilon可以让看作学习过程中的少量偏差的接受程度。

m_h : (0,1)^2 \rightarrow N决定了学习过程中的采样复杂度,换句话说,这个方程可以看作是,为了保证PAC的话,至少需要采样多少样本。实际训练中,其实上m的方程有很多都是满足条件的,一般选择最小的m满足\epsilon\delta的PAC学习。

一般情况下这个m可以被一个关于,\epsilon\delta的方程bound住

对于任意有限假设集,都存在这样的一个m满足要求


General Learning Model:

刚才描述的模型其实很容易推广,可以通过以下两个角度让模型更加一般化

1,删除可实现性假设:上面的PAC模型所需要的条件其实是非常强的,不仅需要在真实分布中采样,而且标注的内容也需要十分准确。下面会介绍Agnostic PAC模型

2,之前介绍的基本都是二分类模型,模型其实可以被推广到各类学习任务当中

Agnostic PAC:

在第一章里面做了这样的一个假设,

\exists h^{\star} \in \mathcal{h} \; such\,that\, \mathbb{P}_{x\sim\mathcal{D}}[h^\star(x) = f(x)] = 1这个假设在很多现实问题里面是不成立的,那么更现实的假设是什么呢?

现在设定\mathcal{D}为x,y的联合分布(之前可以看作是训练数据的真实分布)\mathcal{D}_x\mathcal{D}的边缘分布,代表没标注的x的分布,D((x,y)|x)代表label y 的条件分布。这样去设计模型实际上允许不同的数据具有相同的特征时,属于不同的预测结果。

这样假设的情况下,误差将会被写成如下的形式:

跟之前PAC不同的点就是,在这里括号里不是h(x) 不等于 f(x)

同理,经验风险如下:

同上
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353