四种机器学习曲线

一、方差、偏差与欠拟合、过拟合概念

        1.方差:描述模型对于给定值的输出稳定性.。(强调个体结果与个体期望的远近)

        2.偏差:描述模型输出结果的期望与样本真实结果的差距。(强调整体结果与期望的远近 )

        3.欠拟合:模型不够复杂或者训练数据过少时,模型均无法捕捉训练数据的基本(或者内在)关                              系,会出现偏差。这样一来,模型一直会错误地预测数据,从而导致准确率降低。                            这种现象称之为模型欠拟合。

        4.过拟合:模型过于复杂或者没有足够的数据支持模型的训练时,模型含有训练集的特有信                              息,对训练集过于依赖,即模型会对训练集高度敏感,这种现象称之为模型过拟合。

         注:高方差->过拟合;高偏差->欠拟合

二、类比靶向图

偏差VS方差

左上角表示(低偏差,低方差),这是最理想的状况;

右上角表示(低偏差,高方差),低偏差导致预测结果与真实结果很近,高方差导致个体预测结果不稳定,比较不集中;

左下角表示(高偏差,低方差),高偏差导致预测结果与真实结果很远,低方差导致个体预测结果稳定,比较集中;

右下角表示(高偏差,高方差),高偏差导致预测结果与真实结果很远,高方差导致个体预测结果不稳定,比较不集中;

三、学习曲线

偏差VS方差

左上角是最优情况,随着样本的增加,train error虽然有一定的增加吗,但是 test error却有很明显的降低;

右上角是最差情况,train error很大,模型并没有从特征中学习到什么,导致test error非常大,模型几乎无法预测数据,需要去寻找数据本身和训练阶段的原因;

左下角是high variance的情况,train error虽然较低,但是模型产生了过拟合,缺乏泛化能力,导致test error很高;

右下角是high bias的情况,train error很高,这时需要去调整模型的参数,减小train error。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 假设你去随机问很多人一个很复杂的问题,然后把它们的答案合并起来。通常情况下你会发现这个合并的答案比一个专家的答案要...
    城市中迷途小书童阅读 2,557评论 0 1
  • 简书公式支持不太好,欢迎跳转到机器学习深度学习面试题总结GitHub看完整的总结,GitHub总结比较全,大多数是...
    MrMiaow阅读 3,978评论 1 8
  • 一直想找一个地方,可以尽情挥洒自己的泪水。一直想找一个地方,可以肆无忌惮地开怀大笑。一直想找一个地方,可以静...
    林海西阅读 230评论 1 0
  • 我支持学生阅读,支持学生学习语文,因为通过语文学习培育的信心不仅为语文所用,也可为数学所用。
    太阳_92阅读 222评论 0 1
  • 曾经听过一个段子,说一位准妈妈是个发朋友圈狂魔,她生宝宝的时候,全家人在产房外等了三个多小时,好不容易等到大夫出来...
    liuhuanhuan549阅读 272评论 0 0