1.什么是机器学习
非正式定义:
使计算机学习的能力没有明确编程的学习领域。
正式定义:
一个计算机程序可以从经验E学习一些类别的任务T和性能测量P,如果它的性能在任务T中以P作为测量,随着经验E改善,则称这个程序为机器学习。“
例子:玩跳棋
E =玩许多棋子游戏的经验
T =玩跳棋的任务
P =程序将赢得下一场比赛的概率
一般来说,机器学习可以分为两类:有监督学习和无监督学习
2.有监督学习
在监督式学习中,我们得到了一个数据集,并且已经知道我们的正确输出应该是什么样子,并且认为输入和输出之间存在关系。
监督学习问题分为“回归”和“分类”问题。 在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。 在分类问题中,我们试图预测离散输出中的结果。 换句话说,我们试图将输入变量映射到离散函数。
3.无监督学习
无监督学习使我们能够解决很少或根本不知道我们的结果应该是什么样子的问题。 我们可以从数据中得出结构,我们不一定知道变量的影响。
我们可以通过基于数据中变量之间的关系对数据进行聚类来推导出这种结构。
在无监督学习的情况下,没有基于预测结果的反馈。
总结:有监督学习需要给定确定的数据(某某是什么),多用于预测;无监督学习需要不确定的数据,采用聚类推导出不同的数据结构,多用于分类。
学习建议:
- 使用Octave开始机器学习
- 建立一个有开始时间有截至时间的目标,不断激励自己
- 阅读别人的代码,通过项目入手
- 找一个适合自己的机器学习模型,并学会在计算机上搭建环境