机器学习模型的各项评价指标

机器学习模型分类为有监督学习和无监督学习。

有监督学习

分类Classification

多个分类模型比较
  • 准确率是预测和标签一致的样本在所有样本中所占的比例;
  • 精确率是你预测为正类的数据中,有多少确实是正类;
  • 召回率是所有正类的数据中,你预测为正类的数据有多少。
    这三个数据往往用来衡量一个二分类算法的优劣。

分类模型比较的指标意义:

  • Accuracy 准确率:模型正确预测的样本数占总样本数的比例。准确率越高,模型的性能越好。
  • AUC 值的范围是0.5~1之间,如果小于0.5,则说明模型很烂。AUC 是 ROC 曲线下的面积,它表示模型的区分能力。AUC 越大,模型的性能越好。
  • Recall 召回率:表示实际为正类的样本中,被模型正确预测为正类的样本数占实际为正类的样本数的比例。召回率越高,模型的召回能力越强。
  • Precision 精确率 :模型预测为正类的样本中,实际为正类的样本数占预测为正类的样本数的比例。精确率越高,模型的预测结果越准确。
  • F1: 是精确率和召回率的调和平均值,它综合考虑了模型的准确性和召回率。F1 值越高,模型的性能越好。
  • Kappa
    -MCC
  • 混淆矩阵:Confusion Matrix ,对角线上的值越大,模型越好。利用混淆矩阵可以计算准确率、精确率、召回率等指标。
    一般情况下,我们选择AUC最大的模型
ROC-AUC曲线图

上图中ROC曲线和X围成的区域的面积,即为AUC值,这个图中是多分类模型,可以看到分类值为2的AUC最高为0.66,分类为1的AUC最低为0.46,说明这个模型如果用来预测分类值为1的目标值时,效果非常差。


混淆矩阵

从混淆矩阵也可以看出分类模型的好坏,这是上面的多模型比较后,最优模型LDA的混淆矩阵,对角线的值越大,则模型越好。这个模型显然很差。

回归Regression

多个回归模型比较

单个模型的10重Fold

多个回归模型比较时,比单个模型的10重Fold多了一项是TT即时间。
评价指标

  • MAE 平均绝对正误差Mean Absolute Error,范围是[0,+无穷)
  • MSE 均方误差 (Mean Square Error)
  • RMSE 均方根误差(Root Mean Square Error)
  • R2 值的范围一般是0~1,但是也可能会出现小于0的情况
  • RMSLE 均方根对数误差 (Root Mean Squared Logarithmic Error)
  • MAPE 平均绝对百分比误差(Mean Absolute Percentage Error)
    一般情况下,我们选择的都是R2最大的模型,像上图中,标黄色的都是最优的值。可以看到不同 的指标最优值对应的模型可能不是同一个。R2如果小于0,说明该模型连最基础的模型都不如,即训练值和目标值之间没有线性关系,简单说这个模型很烂。
    例如:上面的10重fold运行的Mean对应的R2是-0.1754,说明这个模型很烂。建议更换选择其他更优的模型。

无监督学习

聚类Clustering

聚类没有办法使用多模型比较,自动选择最优的模型,因为这是无监督学习,程序也不知道哪个是最优的方案。
根据实现的原理和方法差异大概分类:

基于K值聚类有2种方法确定K值:elbow和silhouette

例子1:肘节图能够确定最优K值,轮廓图不能确定最优K值。
elbow 肘节图

kmeans的模型,从上图中看出拐点是3,大于3之后,曲线就是趋于平缓,看到从4到10变化都不大,所以尽量取小的K值,此处即为4.


silhouette轮廓图

上面这个轮廓图就不是好的结果,好的轮廓图,要求是每个层的厚度基本相同,而且每个层都有部分样本超过红色虚线(均值线)。尽量选择均值大的,层数多的。

例子2:肘节图无法区分,轮廓图能够区分选择最佳K值。
这个肘节图没有拐点

这个轮廓图基本可以,优于上面385个样本的轮廓图。实际使用时可以试试K从3-5,对比选择最优

上面的K=4对应的PCA图

从PCA图看出,上面的K=4,划分为4类,是可以分开400个样本的数据的。

dbscan

异常检测Anomaly Detection

时间序列 Time Series Forecasting

时间序列其实也是无监督学习的一种


时间序列的预测模型指标

时间序列的预测周期一定要设置合适,这个值对时间序列的预测结果的准确性影响非常大。
时间序列的评价指标:

  • MASE 平均绝对比例误差
  • RMSSE Root Mean Squared Scaled Error(RMSSE)标准化均方根误差,这个值越接近0越好
  • MAE 平均绝对正误差Mean Absolute Error,范围是[0,+无穷)
  • RMSE 均方根误差(Root Mean Square Error)
  • MAPE 平均绝对百分比误差(Mean Absolute Percentage Error)
  • SMAPE 对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error)
  • R2 值的范围一般是0~1,但是也可能会出现小于0的情况,越接近1越好。
fh=12,设置预测周期为12个月

上图是基于1950-1960航班的乘客数量预测1960-1962年乘客的数量。


fh=3,设置预测周期为3个月

针对统一数据使用不同的预测周期进行预测,可以看到R2的差距是很大的,但是最优模型的MASE,RMSSE,MAE等指标基本接近。

时间序列的ACF和PACF

航班数据的结果

从上图中的ACF和PACF可以看出,数据点基本分布在阴影区间内,说明这个数据模型平稳性比较好。
谷歌的数据

上图中的左侧的ACF出现了振幅梯度递减,数据需要进一步处理才能建模,右侧数据是正常分布在阈值范围内是正常数据。
左侧这种情况,一般是时间序列数据内出现了自相关,这时候使用PACF来确定在哪些时间尺度上出现的,就是PACF图中哪些柱子超出阴影区域,这个横坐标即对应的时间尺度。
PACF图

上图这个PACF图就是数据存在自相关。时间尺度可以选择柱子超出蓝色阴影区域的长的点,例如横坐标为1,2,3,10,13.
差分:时间序列模型建模前的一种数据预处理模式,后一个观测值减去前一个值的差值作为时间序列的值,用来建时间序列模型。这种只减了一次的称为一阶差分,如果得到的值,再来一次差分得到的值,就是二阶差分。有时候,一阶差分的值还是离散很大,就需要继续多次差分。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,125评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,293评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,054评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,077评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,096评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,062评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,988评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,817评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,266评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,486评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,646评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,375评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,974评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,621评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,642评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,538评论 2 352

推荐阅读更多精彩内容