登录注册写文章

Lecture 4：Feasibility of Learning

薛家掌柜的

Lecture 4：Feasibility of Learning

现在我们想这么一个问题：如下图所示，一个罐子里有很多弹珠，但是我们并不知道橙色的弹珠有多少，也不知道绿色的弹珠有多少。

假设bin内橙色弹珠的可能性为

\mu

，那么绿色弹珠的可能性就是

1-\mu

，其中

\mu

是未知的。
从bin内随机取出一个样本，假设样本内橙色弹珠的可能性为

\nu

，那么绿色弹珠的可能性就是

1-\nu

，其中

\nu

是未知的。
那么

\nu

能否代表

\mu

？
我们先看一个公式：Hoeffding's Inequality

Hoeffding's Inequality

in big sample(N large),

\nu

is close to

\mu

(within

\epsilon

)

P[|\nu-\mu| > \epsilon] \leq 2 exp(-2{\epsilon}^2N)

the statement ' $\nu = \mu$ ' is probably approximately correct(PAC)
Hoeffding不等式对于所有的

N

和

\epsilon

都有效，且与

\mu

无关，也就是说不需要提前知道

\mu

。因此

N

足够大或者

\epsilon

足够小时，

\nu \approx \mu

就会成立。

Connection to Learning

将bin内的弹珠求颜色可能性问题对比于机器学习：

那么当

N

和

i.i.d. x_n

足够大的时候，就能通过已知的

h(x_n) \neq y_n

（从样本学习的

h(x_n)

）推出未知的

h(x) \neq f(x)

。
现在我们用

E_{in}(h)

表示in-sample error（也就是

\nu

）用

E_{out}(h)

表示out-sample error（也就是

\mu

）。
for any fixed h,in big 'data' (N large),

E_{in}(h)

is probably close to

E_{out}(h)

(within

\epsilon

)

P[|E_{in}(h)-E_{out}(h) |>\epsilon] \leq 2 exp (-2 \epsilon ^2N)

Note:if ' $E_{in}(h) \approx E_{out}(h)$ ' and ' $E_{in}(h)$ is small' $\Rightarrow$ ' $E_{out}(h)$ 'is small $\Rightarrow$ ' $h \approx f$ 'with respect to $P$

然而，以上所述在真实环境下也真成立吗？

Connection to Real Learning

如果在某个数据集 $D$ 上， $E_{in}(h)$ 、 $E_{out}(h)$ 相差很大，那么这个数据集 $D$ 就是一个BAD Data。

BAD Data for many h

那么对于M个假设(hypothesis),

P_D(BAD

D)

上界是多少呢？

也就是说，

|H|

即假设集(a set of hypothesis)的大小为M(M是有限的)，并且N足够大的时候，无论是什么learning algorithm，

E_{in}(h) \approx E_{out}(h)

当某个learning algorithm

g

能使得

E_{in}(g) \approx 0

,根据PAC(probably approximates correct)能够推出

E_{out}(g) \approx 0

那么，Learning Flow如下图所示：

Learning Flow

最后编辑于：2018.08.28 17:47:50

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

大雪小雪又一年
爱冬天，因为爱雪！爱雪，所以爱冬天！可这个冬天，小雪日，雪无影；大雪日，雪无踪。无雪的冬竟如无阳刚之气的男人，总觉...
君子宜兰阅读 797评论 0赞 4
#每天觉察一点点# Day1【共情与同情】
上午我看了一篇文章《共情和同情，一字之差，决定了爱孩子的深度》，它启发了我，作者的深刻觉察，让我茅塞顿开，...
Shaoerting阅读 336评论 2赞 2
风吹过来的时候你就知道了
你走过的青春有虫鸣有鸟叫有草房子向南打开的窗闲时抚琴，快时舞剑，痛时饮酒常在山间静坐，与这山间的孤魂论道...
李含山阅读 355评论 10赞 13
心里的恶魔
角落里有一个恶魔不知道他已经坐在那里多久了也不知道他从什么时候开始出现的甚至对他的存在都没有察觉很多人就倒...
yiyi_4f59阅读 308评论 0赞 0
【Linux入门第一天】我为什么学习Linux
很早就听说过Linux了，在知乎上看到评论说大神都用Linux系统，自己也想学习一下。最近刚好在电脑上装了Linu...
llDiasyll阅读 151评论 0赞 0

赞1赞

赞赏

手机看全文