文章原创,最近更新:2018-07-17
学习链接:
3.2 Types of Learning -Learning with Different Data Label
学习参考链接:
1、台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning
现在再来讲一下机器学习的变形,从多类别的案例,美国不同硬币的辨别出发.之前是根据收集美国铜板的大小以及重量都收集好,然后将这些资料提供给机器学习.然后机器会提供g.一般把这种方法叫做监督式学习.
如果我们拿到的训练样本D既有输入特征x,也有输出yn,那么我们把这种类型的学习称为监督式学习(Supervised Learning)。监督式学习可以是二元分类、多元分类或者是回归,最重要的是知道输出标签yn.
- 比如这里的案例,知道铜板,并且给予正确的意思是什么?比如重量以及大小对应的铜板意思.这是一个比较完整的教学.
与监督式学习相对立的另一种类型是非监督式学习(Unsupervised learning)。非监督式学习是没有输出标签yn的,典型的非监督式学习包括:聚类(clustering)问题,比如对网页上新闻的自动分类;密度估计,比如交通路况分析;异常检测,比如用户网络流量监测。通常情况下,非监督式学习更复杂一些,而且非监督的问题很多都可以使用监督式学习的一些算法思想来实现。
-
比如不告诉电脑铜板的意思是什么?电脑可不可以学到东西呢?最终会看到的是如下的截图.电脑自己想办法,将铜板分成分为3堆不同的铜板,具体如下:
以上类似于把铜板丢给小朋友,小朋友自己去分堆.并分提供区分硬币的方法.
介于监督式和非监督式学习之间的叫做半监督式学习(Semi-supervised Learning)。顾名思义,半监督式学习就是说一部分数据有输出标签yn,而另一部分数据没有输出标签yn。在实际应用中,半监督式学习有时候是必须的,比如医药公司对某些药物进行检测,考虑到成本和实验人群限制等问题,只有一部分数据有输出标签yn。
主要是应用在:
- 比如今天有很多的照片,需要花费很多的时间将照片找出来有点困难,只能标出少部分的照片.很多照片如果很多没有标记的照片,也许机器可以自动学习.标记的点用彩色的点表示,未标记的点用蓝色点表示.
- 比如试药,费用很贵,只能提供部分的药进行试药.
特点是:要找到标记是因为很贵很费时间,这种情况就需要用到半监督学习.需要用到大部分未标的资料让机器学习自动学习.
监督式、非监督式、半监督式学习是机器学习领域三个主要类型。除此之外,还有一种非常重要的类型:增强学习(Reinforcement Learning)。
增强学习中,我们给模型或系统一些输入,但是给不了我们希望的真实的输出y,根据模型的输出反馈,如果反馈结果良好,更接近真实输出,就给其正向激励,如果反馈结果不好,偏离真实输出,就给其反向激励。不断通过“反馈-修正”这种形式,一步一步让模型学习的更好,这就是增强学习的核心所在。
增强学习可以类比成训练宠物的过程,比如我们要训练狗狗坐下,但是狗狗无法直接听懂我们的指令“sit down”。在训练过程中,我们给狗狗示意,如果它表现得好,我们就给他奖励,如果它做跟sit down完全无关的动作,我们就给它小小的惩罚。这样不断修正狗狗的动作,最终能让它按照我们的指令来行动。实际生活中,增强学习的例子也很多,比如根据用户点击、选择而不断改进的广告系统
应用场景:
- 比如广告系统,比如顾客训练广告系统是怎么做的,输入是顾客的资料,放的广告是可能的输出这就是y,顾客有没有点击这个广告.经过这个过程就知道好不好.这个广告系统就知道什么时候最适合播放广告.
- 比如玩牌或者棋类的游戏,比如21点,在拿到一些牌的情况下,判断是否补发那些牌.
简单总结一下,机器学习按照数据输出标签yn划分的话,包括监督式学习、非监督式学习、半监督式学习和增强学习等。其中,监督式学习应用最为广泛。
题目练习:
一个公司想要做树的辨识系统,收集很多树的照片,让公司的员工进行标记,里面是有树还是没有树.但是很多其他的照片是没有标记,这个演算法到底是解决什么样的问题?
答案是3,半监督学习.