1.基本术语
- 数据集
1)训练集:用于训练模型的数据
2)验证集:用于调节超参数的数据
3)测试集:用于苹果模型性能的数据 - 样本:
数据集中的一条数据 - 特征:
数据集中一列反映事件或对象在某方便的表现和性质的事项 - 特征向量:
将样本的所有特征表示为向量的形式 - 标签:
监督学习中每个样本的结果信息,也叫:目标值 - 模型:
一个机器学习算法和训练后的参数集合,用于预测或分类 - 参数:
模型通过训练学习到的值,例如线性回归中的权重和偏置 - 超参数:
由用户设置的参数,不能通过训练自动学习,例如学习率、正则化系数等