改善深层神经网络-设置机器学习应用

引用Andrew Ng 的一段话:

超参数有很多,隐含层层数选择,隐含层单元节点选择,学习率,激活函数等。一来预设出最匹配的超参数是很困难的,所以应用深度学习是一个典型的迭代过程,需要多次循环往复,才能为应用程序找到一个称心得神经网络。因此,循环该过程的效率是决定项目进展速度的关键因素,而创建高质量的训练数据集,验证集和测试集也有助于提高循环效率。

数据集划分

这有一个常见的误区,在机器学习发展的小数据时代,常见做法是将所有数据三七分,70%训练集,30%测试集或者60%训练集,20%验证集,20%测试集,这是机器学习前几年学习领域普遍认可的最好实践方法,如你的数据是100,1000,1万条按照上述划分是非常合理的。
BUT在大数据时代,我们现在的数据量可能是百万级的,那么验证集和测试集占总数的比例会趋向于变得更小。因为验证集的目的就是为了验证不同的算法,检验哪种算法更加高效。比如我们有一百万的数据,那么拿出1万的数据便足以进行评估,找出其中表现最好的1-2种算法。测试集主要目的是正确评估分类器的性能,同样只需要拿出10000条数据便足以评估单个分类器。所以,假设我们有100万数据,其中1万条做验证集,1万条做测试集。即:训练集98%,验证集和测试集各1%。对于数据量为百万级应用,训练集可以占到99.5%(哭晕在厕所)
注:想清楚每个数据集的作用,而不是机械的记住原来的三七分

偏差 / 方差


如图所示,高偏差将导致欠拟合,高方差将导致过拟合。
在只有两维特征X1,X2,我们可以绘制数据,将偏差和方差可视化,在多维空间绘制数据可视化分割边界将无法实现。但我们可以通过几个指标来知道。

理解偏差和方差的两个关键数据是:

  • 训练集误差
  • 验证集误差

假设训练集误差1%,验证集误差11%,我们可能过度拟合了训练集,某种程度上交叉验证集并没有充分利用交叉验证集的作用,像这种情况,我们称之为高方差。
假设训练集错误率是15%,验证集错误率16%,这属于高偏差欠拟合。
假设训练集错误率是15%,验证集错误率30%,这属于高偏差以及高方差。
假设训练集错误率是0.5%,验证集错误率1%,这属于低偏差以及低方差。

一些解决方案

  • 如果偏差很高甚至无法拟合训练集,那么你要做的就是选择一个新的网络——比如增加隐含层或者隐藏单元,或者花费更多时间训练或者尝试更先进的优化算法
  • 一旦偏差降低到一个可接受的数值,检查一下方差有没有问题,为了评估方差,我们要查看验证集性能。如果方差高,最好的解决办法就是采用更多的数据,但有时候无法获取更多数据,我们也可以通过正则化来减少过拟合
    总之就是不断尝试直到找到一个低偏差低方差的框架。

    注:内容来源于吴恩达deeplearning.ai,为什么想写一篇这么基础的呢?不要问我,踩过的坑只有自己清楚
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350

推荐阅读更多精彩内容