西瓜书学习笔记 01-绪论

1.2 基础术语：

数据集： data set

示例： instance/sample

属性/特征：attribute/feature

属性值： attribute value

属性空间： attribute space

样本空间： sample space

特征向量： feature vector（所有属性/特征为坐标轴张成的向量空间，每个样本的属性值对应的空间向量称为“特征向量”）

样本空间和维数：

维数

训练数据： training data/ training instance，训练样本： training sample，训练集： training set

假设：hypothesis

真相/真实： ground-truth

学习器： learner

预测： prediction

标记： label

标记空间/输出空间： label space

样例： example（拥有标记的示例）

测试：testing，测试样本： testing sample

簇：cluster

泛化能力： generalization（学的的模型适用于新样本）

样本分布： distribution

独立同分布： independent and identically distribution（i.i.d.）

归纳：induction，归纳学习：inductive learning，演绎： deduction

泛化：generalization，特化：specialization

版本空间：version space

分类问题：classification（预测结果是离散的）

1. 二分类：binary classification（只涉及两个类别），正类：positive class，反类：negative class

2. 多分了： multi-class classification（涉及多个分类）

分类问题

回归问题： regression（预测结果是连续值）

聚类问题：clustering（将数据分成若干组/簇）

监督学习：supervised learning（训练数据有标记）- 分类，回归

无监督学习：unsupervised learning（训练数据无标记) - 聚类

1.3 假设空间：

1.4 归纳偏好：

NFL 理论

练习题

1.1 （色泽=*，根蒂= 蜷缩，声音 = *）（色泽= *, 根蒂= *，声音= 浊响）（色泽=清绿，根蒂= 蜷缩，声音 = 浊响）（色泽=清绿，根蒂= 蜷缩，声音 = *）（色泽=清绿，根蒂= *，声音 = 浊响）（色泽=清绿，根蒂= *，声音 = *）（色泽=*，根蒂= 蜷缩，声音 = 浊响）

1.2 这题有点牛逼，直接上网上找到的答案吧：https://blog.csdn.net/icefire_tyh/article/details/52065626

1.3 1. 丢掉矛盾的数据 2. 或者将矛盾的数据先剔除，先学习没有矛盾的数据，然后在用学得的模型预测矛盾的数据，再将矛盾的数据放回数据集进行学习

1.4

1.5 广告推送，汗

最后编辑于：2018.09.20 00:17:58

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

西瓜书学习笔记 01-绪论