机器学习基本概念(二)

上一篇介绍了分类和回归两类任务,这两类任务是按照机器学习可以解决的问题来分类的,下面我按照机器学习在算法上进行分类。

  1. 监督学习
  2. 非监督学习
  3. 半监督学习
  4. 增强学习

监督学习

给机器学习的训练数据拥有“标记”或者“答案”
MNIST数据集.PNG

第一行到最后一行都有“标记”(1.2.3...8.9)
监督学习是给定了机器数据的特征,又给定了机器数据正确的“答案”

  • 图像已经拥有了标定的信息
  • 银行已经积累了一定的客户信息和他们信用卡的信用情况
  • 医院已经积累了一定的病人信息和他们最终确诊是否患病情况
  • 市场积累了房屋的基本信息和最终成交的金额

监督学习算法:

  • k近邻
  • 线性回归和多项式回归
  • 逻辑回归
  • SVM
  • 决策树和随机森林

非监督学习

非监督学习.PNG

给机器的训练数据没有任何“标记”或者“答案”

非监督学习的意义
聚类分析.PNG
  • 对没有“标记”的数据进行分类 - 聚类分析
  • 对数据进行降维处理
    • 特征提取:信用卡的信用评级和人的胖瘦无关?
    • 特征压缩:PCA算法
      • 尽量少的损失信息的情况下将高维降为低维度,提升机器学习的运行效率,但不影响机器学习的准确率
      • 降维处理的意义:方便可视化
        可视化.PNG

        人类对于高纬度的空间是不可以理解的,有时候把高维数据降低,可以直观的对数据进行理解

      • 异常检测
        异常检测.PNG

        有一些数据是有异常的,图中的红点是有异常的,这种点不能反应事物的一般性。相应的算法剔除这种异常点

半监督学习

一部分数据有“标记”或者“答案”,另一部分数据没有
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测

增强学习

根据周围环境的情况,采取行动,根据采取行动的结构,学习行动方式。
增强学习.PNG

Agent 算法
reward 奖赏
state 惩罚
action 行动
environment 环境

算法 采取行动,环境反馈给算法奖赏和惩罚,算法做出相应的调整再对环境采取行动。通过行动反馈,增强自己的智能。增强学习非常适合机器人。
AlphaGo.PNG

AlphaGo就是在对局中进行增强学习。
增强学习:
  • 无人驾驶
  • 机器人(强人工智能机器人)


    机器人.PNG
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容