机器学习算法常用度量指标

1. 混淆矩阵

常用术语:
True positive(TP):被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;
False positive(FP):被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;
False negative(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;
True negative(TN):被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数;


混淆矩阵

分类:

Metric 正确率(Accuracy) 准确率(Precision) 错误率(ErrorRate) 灵敏度(Sensitive) 特效度(Specificity) 召回率(Recall) F-Score
定义

1. Roc

  • TPR :将正例分对的概率,作为ROC曲线的纵轴。


  • FPR:将负例错分为正例的概率,作为ROC曲线的横轴。


    ROC曲线示例

2. AUC

AUC值为ROC曲线下所覆盖的区域面积,显然,AUC越大,分类器效果越好。

3. P-R曲线


回归评估指标

Metric MAE MSE RMSE MAPE MASE
定义

距离/相似度

Metric EculideanDistance MinkowskiDistance ManhattanDistance ChebyshevDistance MahahanobisDsitance CosineSimilarity Person Similarity Jaccard Corfficient Mutual Information KL Divergence JS Divergence Earth Mover's Distance(Wasserstein Distance)
定义

计算视觉评估指标

推介系统

自然语言处理

信息检索



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容