西瓜书学习笔记 01-绪论

1.2 基础术语:

数据集: data set

示例: instance/sample

属性/特征:attribute/feature

属性值: attribute value

属性空间: attribute space

样本空间: sample space

特征向量: feature vector(所有 属性/特征 为坐标轴张成的向量空间,每个样本的属性值对应的空间向量称为“特征向量”)

样本空间和维数:

维数

训练数据: training data/ training instance, 训练样本: training sample, 训练集: training set

假设:hypothesis

真相/真实: ground-truth

学习器: learner

预测: prediction

标记: label

标记空间/输出空间: label space

样例: example(拥有标记的示例)

测试:testing,测试样本: testing sample

簇:cluster

泛化能力: generalization(学的的模型适用于新样本)

样本分布: distribution

独立同分布: independent and identically distribution(i.i.d.

归纳:induction,归纳学习:inductive learning, 演绎: deduction

泛化:generalization, 特化:specialization

版本空间:version space


分类问题:classification(预测结果是离散的)

    1.  二分类:binary classification(只涉及两个类别), 正类:positive class, 反类:negative class

    2. 多分了: multi-class classification(涉及多个分类)


分类问题

回归问题: regression(预测结果是连续值)

聚类问题:clustering(将数据分成若干组/簇)



监督学习:supervised learning(训练数据有标记)- 分类, 回归

无监督学习:unsupervised learning(训练数据无标记)  - 聚类



1.3 假设空间:

1.4 归纳偏好:


NFL 理论

练习题

1.1 (色泽=*,根蒂= 蜷缩,声音 = *)(色泽= *, 根蒂= *,声音= 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = 浊响)(色泽=清绿,根蒂= 蜷缩,声音 = *)(色泽=清绿,根蒂= *,声音 = 浊响)(色泽=清绿,根蒂= *,声音 = *)(色泽=*,根蒂= 蜷缩,声音 = 浊响)

1.2 这题有点牛逼,直接上网上找到的答案吧:https://blog.csdn.net/icefire_tyh/article/details/52065626

1.3  1. 丢掉矛盾的数据 2. 或者将矛盾的数据先剔除,先学习没有矛盾的数据,然后在用学得的模型预测矛盾的数据,再将矛盾的数据放回数据集进行学习

1.4 

1.5 广告推送,汗

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容