读书笔记-美团机器学习实践-评价指标

分类问题

常见的评价指标有

  1. 精确率(真正/(真正+假正))和召回率(真正/(真正+假负))
  2. 以召回率为横轴,精确率为纵轴的P-R曲线。这样的曲线越接近右上角越好。
  3. P-R曲线下的面积AP分数(Average precision score),不过计算不方便。
  4. F1值:精确率和召回率的调和平均
  5. 准确率和错误率(相加为1)
  6. ROC和AUC: 很多情况下,模型输出的预测概率,我们队预测概率排序,依次设置分类阈值,当预测概率大于阈值时为正例,否则为负例。这样就多了一个超参数,这个超参数也会影响模型的泛化能力。ROC曲线的纵坐标为真正率(召回率,正例中被预测成正例的),横坐标是假正率(假正/(假正+真负),也就是负例中被预测成正例的)。ROC曲线越接近最上角性能越好。AUC是ROC曲线下的面积,越大说明越可能将正例排在负例之前。

注意点

1.准确率和精确率是一个东西吗?
答:不是。精确率的关注重点是分对的正例,准确率是关注有多少被分对了,包括正例和反例。

  1. AUC有什么神奇的性质,为什么?
    答:
  • AUC等于随机挑选一个正例和负例,正例排在负例前的概率;
  • AUC=Gini+1;
  • AUC和Wilcoxon Test of Rank等价。Wilcoxon-Mann-Witney Test就是测试任意给一个正类样本和一个负类样本,正类样本的score有多大的概率大于负类样本的score。
  1. 从ROC曲线到AUC值,再到Mann–Whitney U统计量
    https://blog.csdn.net/Joyliness/article/details/79156879 讲的通俗易懂,但是还是太难懂了。搞数学的人都是富有想象力的~

回归问题

  1. 平均绝对误差MAE,L1范数损失。预测值和真实值的平均绝对值。MAE可以很好的刻画预测值和真实值的偏差。是对数据分布的均值进行拟合
  2. 加权平均误差(WMAE):MAE的变种评价指标,考虑每条样本的权重。
  3. 平均绝对百分误差(MAPE):误差相对于真实值的百分比值的平均值。但是对真实值为0的情况会导致这个百分比接近100%,需要修正。
  4. 均方根误差(RMSE): 样本的标准差。和MAE相比,对大误差样本有更大的惩罚;缺点是对离群点敏感。** 是对数据分布的平均值进行拟合**
  5. 均方根对数误差(RMSLE):均方根误差的变种,这种会对预测值偏小的样本有更大的惩罚。需要先把预测值转为ynew=log(y+1)。在预测之后在还原p=exp(pnew)-1

排序问题

暂时没有接触过,略过

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 宝玉挨打后,因心下记挂着黛玉,满心里要打发人去,只是怕袭人,便设一法,先使袭人往宝钗那里去借书.袭人去了,宝玉便命...
    婉㚥阅读 4,722评论 4 5
  • 你还记得小时候因为小伙伴的一句话,你伤心了很久吗?你还记得上学时因为老师的一句话,你自卑了很久吗?你还记得因为爱人...
    戴眼镜的催催阅读 3,579评论 0 1
  • 昨天,东方卫视 晚剧场《欢乐颂2》大结局了。 一年总结一年成长,大家都说得那么好。 我呢,也想说点什么。 半年多了...
    爱娇阅读 4,447评论 0 0
  • 兰州山里的秋,来的格外早些。下午星星点点下了几粒雨,北风一吹,竟觉有些凉了。 山里春秋难辨,漫山遍野的荒莽凄凉,即...
    嘿别叫我老关阅读 4,453评论 0 1