机器学习是许多重要应用的基础,比如网页搜索,反垃圾邮件,语音识别,物品推荐等等。如果你或你的团队正在研究一项机器学习应用,并且你想要取得快速的进展,那么这本书将会给你提供帮助。
示例:建立一个创业公司,其业务是识别猫的图像
就是说你建立了一个创业公司,可以为猫爱好者提供无穷无尽的猫图片。你正在使用一个神经网络建立一个计算机视觉系统来检测图片中的猫。
但遗憾的是,你的学习算法的准确率目前并不够好。你面临巨大的压力来改善你的“猫检测器”。你能做些什么呢?
你的团队有很多想法,比如:
- 获取更多数据:收集更多猫的图片
- 收集一个更加多样化的训练集。例如:猫处于不同位置的图片;不同颜色的猫;不同相机(设置)拍摄的图片
- 通过运行更多次梯度下降的迭代,来增长训练算法的时间
- 尝试更大的神经网络,具有更多的层/隐藏单元/参数
- 尝试一个小一点的神经网络(也许是样本不够?)
- 试着添加正则项(比如L2正则)
- 改变神经网络的结构(激活函数,隐藏单元的数量等)
- ...
在这些可能的方案中,如果你选择的好,那么你将建立一个不错的猫图片识别的平台,并带领你的公司走向成功;而如果你选择的很差,那么你可能会白白浪费几个月的时间。你该怎么办?
这本书将会告诉你如何做出选择。大部分机器学习问题都会留下一些线索,这些线索会告诉你什么是有用的尝试,什么是没用的。学会阅读理解这些线索能够节省你数月或上年的开发时间。