1.样本/示例:关于一个事件或对象的描述。
2.样本集/属性集:样本的集合
3.属性/特征:反映事件或对象在某方面的表现或性质
4.样本值/属性值
5.学习/训练:通过数据寻找最优化模型
6.训练数据:训练过程中使用的数据
7.训练样本:训练过程中的每一个样本
8.标记/标签:样本的结果信息
9.输出空间/标记空间:标记结果的集合
10.样例:拥有了标记信息的样本
11.预测:利用已有数据学习得到一个规律,用该规律得到输出结果。
12.测试:通过学校得到的模型预测出得到的结果,与样本进行监测的过程。
13.分类:预测结果为离散值
14:回归:预测结果为连续值
15:聚类:物以类聚。按照某一特定的标准,把一个数据集分割成不同的类或簇,让同一簇内的数据对象相似性尽可能大,不在同一个簇的差异性尽可能大。
16:监督学习/有导师学习:学习任务为分类或回归,样本具有标记信息。
17.无监督学习/无导师学习:学习任务为聚类问题,样本无标记信息。
18.半监督学习:利用无监督学习算法训练得到参数,然后用一部分加了标签的数据测试。
19.强化学习:以试错的方式进行学习,通过交互获得奖赏指导行为,目标是获得最大的奖赏。