1.机器学习的基本概念和词汇

机器学习词汇

目标:预测类别或数据值(要预测的列)

特征:用于预测的数据属性(非目标列)

样本:数据内的单个数据点(1 行)

标签:单个数据点的目标值

机器学习词汇(近义词)

目标:响应、输出、因变量、标签

特征:预测器、输入、自变量、属性

样本:观察、记录、实例、数据点、行

标签:答案、y 值、类别


监督式机器学习:数据有已知输出结果

回归:输出结果是连续的(数字)

分类:输出结果是一个类别 

非监督式机器学习:数据有未知输出结果 


三种分类预测类型

严苛预测(Hard Prediction):针对每个实例预测一种类别。

排名预测:按照从最有可能到最不可能的顺序对实例进行排列。(二元分类)

概率预测:为每个实例跨类别分配概率分布。


分类指标

严苛预测(Hard Prediction):准确性(Accuracy)、精度(Precision)、召回(Recall)(敏感度(Sensitivity))、特异性(Specificity)、F1 分数(F1 Score)

排名预测:AUC (ROC)、精度-召回曲线(Precision-Recall Curves)

概率预测:Log-loss(亦称交叉熵)、Brier(布莱尔)分数


回归指标

均方根误差(RMSE)


平均绝对偏差

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容