登录注册写文章

读书笔记-美团机器学习实践-评价指标

欠我的都给我吐出来

读书笔记-美团机器学习实践-评价指标

分类问题

常见的评价指标有

精确率（真正/(真正+假正)）和召回率（真正/(真正+假负)）
以召回率为横轴，精确率为纵轴的P-R曲线。这样的曲线越接近右上角越好。
P-R曲线下的面积AP分数（Average precision score），不过计算不方便。
F1值：精确率和召回率的调和平均
准确率和错误率（相加为1）
ROC和AUC：很多情况下，模型输出的预测概率，我们队预测概率排序，依次设置分类阈值，当预测概率大于阈值时为正例，否则为负例。这样就多了一个超参数，这个超参数也会影响模型的泛化能力。ROC曲线的纵坐标为真正率（召回率，正例中被预测成正例的），横坐标是假正率（假正/(假正+真负)，也就是负例中被预测成正例的）。ROC曲线越接近最上角性能越好。AUC是ROC曲线下的面积，越大说明越可能将正例排在负例之前。

注意点

1.准确率和精确率是一个东西吗？
答：不是。精确率的关注重点是分对的正例，准确率是关注有多少被分对了，包括正例和反例。

AUC有什么神奇的性质，为什么？
答：

AUC等于随机挑选一个正例和负例，正例排在负例前的概率；
AUC=Gini+1;
AUC和Wilcoxon Test of Rank等价。Wilcoxon-Mann-Witney Test就是测试任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。

从ROC曲线到AUC值，再到Mann–Whitney U统计量
https://blog.csdn.net/Joyliness/article/details/79156879 讲的通俗易懂，但是还是太难懂了。搞数学的人都是富有想象力的~

回归问题

平均绝对误差MAE，L1范数损失。预测值和真实值的平均绝对值。MAE可以很好的刻画预测值和真实值的偏差。是对数据分布的均值进行拟合
加权平均误差（WMAE):MAE的变种评价指标，考虑每条样本的权重。
平均绝对百分误差（MAPE）：误差相对于真实值的百分比值的平均值。但是对真实值为0的情况会导致这个百分比接近100%，需要修正。
均方根误差（RMSE）：样本的标准差。和MAE相比，对大误差样本有更大的惩罚；缺点是对离群点敏感。** 是对数据分布的平均值进行拟合**
均方根对数误差（RMSLE）：均方根误差的变种，这种会对预测值偏小的样本有更大的惩罚。需要先把预测值转为ynew=log(y+1)。在预测之后在还原p=exp(pnew)-1

排序问题

暂时没有接触过，略过

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

宝玉送旧帕，黛玉添愁丝
宝玉挨打后，因心下记挂着黛玉，满心里要打发人去，只是怕袭人，便设一法，先使袭人往宝钗那里去借书．袭人去了，宝玉便命...
婉㚥阅读 1,311评论 4赞 6
思维导图拆书笔记——《非暴力沟通》2
你还记得小时候因为小伙伴的一句话，你伤心了很久吗？你还记得上学时因为老师的一句话，你自卑了很久吗？你还记得因为爱人...
戴眼镜的催催阅读 595评论 0赞 1

肾移植手术半年啦！
昨天，东方卫视晚剧场《欢乐颂2》大结局了。一年总结一年成长，大家都说得那么好。我呢，也想说点什么。半年多了...
爱娇阅读 1,010评论 0赞 0
家里春秋
兰州山里的秋，来的格外早些。下午星星点点下了几粒雨，北风一吹，竟觉有些凉了。山里春秋难辨，漫山遍野的荒莽凄凉，即...
嘿别叫我老关阅读 985评论 0赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文