2.1机器学习三要素
模型+策略+算法
- 模型:总结数据的规律,用数学语言描述参数系统
- 策略:选取最优的评价准则
- 算法:选取最优模型的具体方法
2.2 机器学习方法分类
2.2.1 按监督分类
| 按监督分类 |
|---|
| 有监督学习 |
| 无监督学习 |
| 半监督学习 |
- 有监督学习 :提供数据并提供数据对应结果的机器学习过程,主要分为:分类 和 回归
2.2.1.1 有监督学习
- 分类和回归
当输出被限制为有限的一组值(离散数值)时,使用分类算法;
当输出可以具有范围内的任何数值(连续数值)时使用回归算法
预测结果是「固定几个选项二选一 / 几选一」 → 分类算法
预测结果是「随便一个具体数字(可以带小数)」 → 回归算法
1)分类
模型能给出的答案早就被框死了,只有有限几种,不能随便出一个新数字、不能有中间状态。
特点:
答案可数、固定、不连续
只能从既定列表里挑一个举例子全是分类:
预测天气:只能是【晴天、阴天、下雨】3 种
预测性别:只能【男、女】2 种
预测股票:只能【上涨、下跌、横盘】3 种
判断邮件:【垃圾邮件、正常邮件】
识别图片:【猫、狗、人】
2)回归
模型要给出的答案是一个区间里的任意数字,可以是整数、可以是小数点,有无穷多种可能。
特点:
数字连续、可无限细分
没有固定选项,想输出多少是多少举例子全是分类:
预测明天气温:25.6℃、27.3℃(10~40 之间随便哪个数)
预测房价:289.5 万、312.8 万
预测明天股价:746.35 美元
预测一个人身高:173.4cm
3)相似度学习
使用相似性函数从样本中学习,这个函数可以度量两个对象之间的相似度和关联度。
普通机器学习:学「是什么」(分类、回归)
相似度学习:学「像不像、近不近」
它不学固定标签,而是学习一种距离 / 相似关系。
2.2.1.2 无监督学习
提供数据并不提供数据对应结果的机器学习过程
2.2.1.3 强化学习
通过与环境交互并获取延迟返回,进而改进行为的学习过程

2.2.2 按模型性质分类
| 按模型性质分类 |
|---|
| 概率模型 |
| 非概率模型 |
| 线性模型 |
| 非线性模型 |
2.2.2 按算法分类
| 按算法分类 |
|---|
| 贝叶斯学习 |
| 核方法 |