02- 机器学习基本理论

2.1机器学习三要素

模型+策略+算法

  • 模型:总结数据的规律,用数学语言描述参数系统
  • 策略:选取最优的评价准则
  • 算法:选取最优模型的具体方法

2.2 机器学习方法分类

2.2.1 按监督分类

按监督分类
有监督学习
无监督学习
半监督学习
  • 有监督学习 :提供数据并提供数据对应结果的机器学习过程,主要分为:分类回归

2.2.1.1 有监督学习

  • 分类和回归
    当输出被限制为有限的一组值(离散数值)时,使用分类算法;
    当输出可以具有范围内的任何数值(连续数值)时使用回归算法

预测结果是「固定几个选项二选一 / 几选一」 → 分类算法
预测结果是「随便一个具体数字(可以带小数)」 → 回归算法

1)分类
模型能给出的答案早就被框死了,只有有限几种,不能随便出一个新数字、不能有中间状态。

  • 特点:
    答案可数、固定、不连续
    只能从既定列表里挑一个

  • 举例子全是分类:
    预测天气:只能是【晴天、阴天、下雨】3 种
    预测性别:只能【男、女】2 种
    预测股票:只能【上涨、下跌、横盘】3 种
    判断邮件:【垃圾邮件、正常邮件】
    识别图片:【猫、狗、人】

2)回归
模型要给出的答案是一个区间里的任意数字,可以是整数、可以是小数点,有无穷多种可能。

  • 特点:
    数字连续、可无限细分
    没有固定选项,想输出多少是多少

  • 举例子全是分类:
    预测明天气温:25.6℃、27.3℃(10~40 之间随便哪个数)
    预测房价:289.5 万、312.8 万
    预测明天股价:746.35 美元
    预测一个人身高:173.4cm

3)相似度学习
使用相似性函数从样本中学习,这个函数可以度量两个对象之间的相似度和关联度。

普通机器学习:学「是什么」(分类、回归)
相似度学习:学「像不像、近不近」
它不学固定标签,而是学习一种距离 / 相似关系。

2.2.1.2 无监督学习

提供数据并不提供数据对应结果的机器学习过程

2.2.1.3 强化学习

通过与环境交互并获取延迟返回,进而改进行为的学习过程

2.2.2 按模型性质分类

按模型性质分类
概率模型
非概率模型
线性模型
非线性模型

2.2.2 按算法分类

按算法分类
贝叶斯学习
核方法
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容