机器学习(周志华版)个人笔记--第一章

数据集、属性、向量、维数

如我们预测的是离散值,例如“好瓜”“坏瓜”,此类学习任务称为“分类

若预测的是连续值,例如西瓜的成熟度0.95、0.37,此类学习任务称为“回归

对只涉及俩个类别的“二分类”任务,通常称其中一个类为“正类”,另一类为“反类”,涉及多个分类为“多分类”,

标记空间、回归、分类、测试
聚类

泛化能力:机器学习的目标是使学得的模型能很好地适用于“新样本”,而不是仅仅在训练样本上工作得很好;即便对聚类这样的无监督学习任务,我们也希望学得的簇划分能适用于没有在训练集中出现的样本,学习模型适用于薪样本的能力,称为泛化能力。

假设空间

归纳与演绎
假设空间

3、2、2种可能取值:假设空间是:(3+1)*(2+1)*(2+1)
+1 = 37,要把每个属性取什么值都可以“*”考虑进去,还要考虑概念不成立+1

版本空间:现实问题中我们常面临很大的假设空间,单学习过程中是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即存在着一个与训练集一致的“假设集合”,我们称之为“版本空间”

删除与正例不一致的假设和与反例一致的假设

归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好

奥卡姆剃刀是一种常用的、自然科学研究中最基本的原则,即”若有多个假设与观察一致,则选最简单的那个“

奥卡姆剃刀
两种可能性都可能存在(没有免费午餐定理NFL)
算法的相对优劣,必须针对具体的学习问题

学习算法自身的归纳偏好与问题是否相配,往往会起到决定性的作用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容