吴恩达《Machine Learning Yearning》学习笔记-2

第二部分:基本错误分析

1. 在开始一个新项目(特别是当你不是该领域的专家)的时候,选择最合适的方向通常很困难。所以不要试图一开始就能设计和构建出最完美的系统。应该以最快速度构建和训练出一个基本的模型。然后利用错误分析的方法来帮助团队确定最有前景的改进方向,并以此为基础迭代式地改进算法。

2. 通过人工检查约100个算法分类错误的开发集例子,并将这些例子归类,来进行错误分析。利用错误类型及占比等信息来确定各种解决方案的优先级。

3. 考虑将开发集数据分成肉眼检查用的开发集和黑盒开发集。如果肉眼检查用的开发集上的算法性能远好于黑盒开发集的,那么说明在肉眼检查用的开发集上发生了过拟合,你需要获取更多的数据。

4. 肉眼检查用开发集需要足够大,能够反映出算法的分类错误信息。对于很多应用而言,1000-10000个样本组成的黑盒开发数据集够用了。

5. 如果开发集不够大,那么使用整个开发集作为肉眼检查用开发集,用于人工进行错误分析、模型选择和超参数调节。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、机器学习策略的原因 机器学习是无数重要应用程序的基础,包括网络搜索,电子邮件反垃圾邮件,语音识别,产品推荐等。...
    阳光前阅读 711评论 0 0
  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,047评论 2 89
  • 亲爱的朋友, 祝好!现在是五月十八日的下午三点半,我无所事事了半个下午,给你写信。 今天上午和石头一同前往去看...
    居无所处阅读 439评论 0 1
  • 画画是一件很美好的事情,画完之后感觉自己一点点进步,特别有成就感,每天会有很多画的特别棒的人把画分享在简书上,非常...
    假面人啊阅读 386评论 0 2
  • “假如一个人失去了他的全部金钱,那他只失去了他人生的一小部分,假如他失去了他的智慧,那他就失去了他人生的大部分了。...
    长发美女阅读 528评论 0 1