一、监督学习
监督学习是根据给出的实际的数据作为样本,可以看作是一组“标准答案”,供机器进行学习,以达到当你输入一个数据,机器可以基于学习的程度预测出你输入数据对应的预测变量。监督学习可以分为两类,一类是回归问题,另一类是分类问题。
1、回归问题
“回归”暗示了我们需要预测的变量是连续的。例如当你需要预测你的房子对应的市场价格,我们输入市场上对应的房子面积的市场价格供机器进行学习,此时这些数据是连续的,机器学习完毕后,你再输入你的房子的面积,机器可以预测出其对应的可能市场价格。
2、分类问题
在分类问题中我们需要处理的变量是离散的而不是连续的。例如需要一个算法学会预测肿瘤是否为恶性的,我们收集了肿瘤大小的数据,所以肿瘤只有恶性和良性之分,因此我们在建立坐标系的时候,对应的Y轴的取值只能有两个或者说是0或1。
大多数时候我们需要预测一个变量的时候需要的数据特征是不止一个的,比如年龄和肿瘤大小与肿瘤的良恶性之间的关系。这就关系到如果你的数据不能在二维、三维甚至任何有限的空间中表示出来,我们该怎么办,有一个被称为支持向量机的算法可以把数据映射到无限维的空间中,这样就可以处理无限维的特性了,之后会讨论。
二、无监督学习
当预测肿瘤良恶性时,我们输入一组数据,来判定了肿瘤是否为恶性,这是监督学习,因为我们为每一位病人都设定了“标准答案”,由于我们设定了“标准答案",所以我们希望我们的程序能够预测出下一位病人的标准答案。而无监督学习,是给出你一组数据而不告诉你这组数据的任何正确答案,然后我们就会询问程序,是否能在这组数据中找到一些有趣的结构。而聚类问题就是无监督学习的一个例子。
聚类问题
例如根据一张图像进行像素的聚类分析,就是说哪些像素可能是在一起的;再比如在一个鸡尾酒会中,有许多人在同时说话,我们如何将我们想要的人的声音单独筛选出来呢?这就需要无监督学习的算法了。
总结无监督学习,可以看作数据结构的分析。
三、强化学习
想象我们在训练一只狗,每次这只狗在做了一件令你满意的事的时候,你就对它说“好狗”,然后奖励它;每次做了坏事,就说“坏狗”。渐渐的,你的狗就学会了去做正确的事来获取更多的奖励,得到更多“好狗”,而不是坏狗。
机器的学习也是如此,他们通过控制自己以获取更多积极的回报,所以强化学习的关键是我们要找到一个正确的好的行为的定义和一个坏的行为,之后就是需要一个学习型的算法,来尽可能地获取更多的汇报和更少的惩罚。