机器学习词汇
目标:预测类别或数据值(要预测的列)
特征:用于预测的数据属性(非目标列)
样本:数据内的单个数据点(1 行)
标签:单个数据点的目标值
机器学习词汇(近义词)
目标:响应、输出、因变量、标签
特征:预测器、输入、自变量、属性
样本:观察、记录、实例、数据点、行
标签:答案、y 值、类别
监督式机器学习:数据有已知输出结果
回归:输出结果是连续的(数字)
分类:输出结果是一个类别
非监督式机器学习:数据有未知输出结果
三种分类预测类型
严苛预测(Hard Prediction):针对每个实例预测一种类别。
排名预测:按照从最有可能到最不可能的顺序对实例进行排列。(二元分类)
概率预测:为每个实例跨类别分配概率分布。
分类指标
严苛预测(Hard Prediction):准确性(Accuracy)、精度(Precision)、召回(Recall)(敏感度(Sensitivity))、特异性(Specificity)、F1 分数(F1 Score)
排名预测:AUC (ROC)、精度-召回曲线(Precision-Recall Curves)
概率预测:Log-loss(亦称交叉熵)、Brier(布莱尔)分数
回归指标
均方根误差(RMSE)
平均绝对偏差