文章原创,最近更新:2018-06-27
学习链接:
1.4 The Leaming Problem-Components of Leaming
1.Components of Learning Metaphor Using Credit Approval
假设有个银行,决定要不要发信用卡给它的顾客,这个顾客会按时还款还是不会按时还款?这是银行想要决定的事情.
那么银行手上有哪些资料呢?有顾客的资料,比如年龄,收入等等.
那么银行希望的就是他发放的信用卡怎么样可以获利最好?
2.Formalize the Learning Problem
开始用符号来表示一些问题,这个符合以后会慢慢抽象化.
- 把银行申请书相关的资料叫做x(这是是输入)
-
想要机器给出的答案叫做y,这里有两种选择,一种是发卡一种是不发卡.
然后机器学习底下某个可以学得到的东西,我们取一个名字叫target function,即是目标函数,然后用f来代表.这个f表示我们想要学,但是我们不知道的东西.
这个f函数是从哪里到哪里呢?从X所在的集合到Y所在的集合.这个是理想上我们想学的公式是怎么样的?
那么我们是如何开始机器学习呢?需要有机器学习的资料,那么资料长什么样子呢?D={(x1,y1),(x2,y2),……,(xn,y)},共有n笔的资料.这是顾客之前历往收集的资料,比如顾客的信用程度等等情况.这个资料用D来表示.
那么机器学到的是什么呢?不见得学到f,f是我们想象但是不知道的.我们希望机器学习能够告诉我们一个函数,这个函数叫做hypothesis.
机器会猜猜看,好的公式到底会长什么样子?那么我们把这个函数叫做g,我们希望g的表现很好,机器学习想要表现的事情,我们希望g的表现很好.机器实际上会告诉我们答案的是g,银行会拿这个g来衡量会不会给未来的顾客信用卡.
有了这个公式,我们将之前简单的机器学习流程图稍微的符号化了.
我们从资料{(xn, yn)}出发,最后机器学习告诉我们g.这个资料是我们想学但是又学不到的模式.
3.Learning Flow for Credit Approval
下面来讲解一下更详细的流程,从左上角f理想的公式,产生了资料D:(x1,y1),…,(xN,yN),这个过程我们不知道,就是假设这样的事情发生了.然后把这些资料汇总给机器学习演算A,然后机器学习会告诉我们到底哪个g.这个g是代表某种效能的增进.这个g与f越像越好,这样我们就说g很棒,否则g就很差.我们希望g与f越像越好.
值得提醒的是两件事情,具体如下:
- 一是f我们是不知道的,如果知道的话就不需要机器学习.
- 二是我们希望g与f很像,因为f不知道,所以g通常不会与f一模一样,只能是越像越好.
那么g到底长什么样子的呢?
来看看以下的例子,如果我们今天决定要不要核发给顾客信用卡,需要申请的可能条件如下:
- 一个人的年收入到底有没有超过80万台币?超过就给,不超过就不给.
- 如果一个人负债超过10万,我们就给信用卡.是不是有点太荒谬了?
- 一个人的工作不满2年的话就给信用卡,因为年轻人花钱比较厉害.
我们把很多种可能的公式叫做h,全部集合起来放在H里面,机器学习应该做的事情是看到资料里面,g的长相放在一个H集合里面,选H集合里面最好的一个出来,然后当作g.
机器学习演算法可以看作是由两个输入,一个是看到资料,你到底允许它选择那个H
机器学习有不同的模型,它使用的就是演算法A以及H.
4.Practical Definition of Machine Learning
对机器学习有个更具体的定义,这个机器学习是我们从资料出发,机器学习要算出g,这个g要接近f
5.Fun Time
这里是每个使用者会给每首歌多少分这个问题.从这个问题,我们列出S1,S2,S3,S4.共有4个不同的集合.具体属于哪个集合呢?我们一起来看看.
这个正确答案是2
从资料出发,最后我们得到了g,这个g是个函数,从我们输入到输出的部分.