已经开始看的不懂了,只知道概念……
第三周 目标检测(Object detection)
3.1 目标定位(Object localization)
如何利用神经网络进行对象定位,即通过输出四个参数值、、和给出图片中对象的边界框。
3.2 特征点检测(Landmark detection)
3.3 目标检测(Object detection)
这种算法叫作滑动窗口目标检测,因为我们以某个步幅滑动这些方框窗口遍历整张图片,对这些方形区域进行分类,判断里面有没有汽车。
滑动窗口目标检测算法也有很明显的缺点,就是计算成本,因为你在图片中剪切出太多小方块,卷积网络要一个个地处理。如果你选用的步幅很大,显然会减少输入卷积网络的窗口个数,但是粗糙间隔尺寸可能会影响性能。反之,如果采用小粒度或小步幅,传递给卷积网络的小窗口会特别多,这意味着超高的计算成本。
3.4 滑动窗口的卷积实现(Convolutional implementation of sliding windows)
以上就是在卷积层上应用滑动窗口算法的内容,它提高了整个算法的效率。不过这种算法仍然存在一个缺点,就是边界框的位置可能不够准确。
3.5 Bounding Box预测(Bounding box predictions)
3.6 交并比(Intersection over union)
3.7 非极大值抑制(Non-max suppression)
到目前为止你们学到的对象检测中的一个问题是,你的算法可能对同一个对象做出多次检测,所以算法不是对某个对象检测出一次,而是检测出多次。非极大值抑制这个方法可以确保你的算法对每个对象只检测一次
3.8 Anchor Boxes
而anchor box的思路是,这样子,预先定义两个不同形状的anchor box,或者anchor box形状,你要做的是把预测结果和这两个anchor box关联起来。一般来说,你可能会用更多的anchor box,可能要5个甚至更多,但对于这个视频,我们就用两个anchor box,这样介绍起来简单一些。
3.9 YOLO 算法(Putting it together: YOLO algorithm)
开始看不懂了
3.10 候选区域(选修)(Region proposals (Optional))
第四周 特殊应用:人脸识别和神经风格转换(Special applications: Face recognition &Neural style transfer)
4.1 什么是人脸识别?(What is face recognition?)
所谓的人脸识别就是通过识别人脸来判断不同的人,比如现在运用在了门禁以及手机解锁等。
4.2 One-Shot学习(One-shot learning)
脸识别所面临的一个挑战就是你需要解决一次学习问题,
所以要让人脸识别能够做到一次学习,为了能有更好的效果,你现在要做的应该是学习Similarity函数。详细地说,你想要神经网络学习这样一个用d表示的函数,,它以两张图片作为输入,然后输出这两张图片的差异值。
4.3 Siamese 网络(Siamese network)
4.4 Triplet 损失(Triplet 损失)
4.5 人脸验证与二分类(Face verification and binary classification)
总结一下,把人脸验证当作一个监督学习,创建一个只有成对图片的训练集,不是三个一组,而是成对的图片,目标标签是1表示一对图片是一个人,目标标签是0表示图片中是不同的人。利用不同的成对图片,使用反向传播算法去训练神经网络,训练Siamese神经网络。
4.6 什么是神经风格迁移?(What is neural style transfer?)
就是通过利用卷积神经网络来在一张图片上运用另外一张照片的风格。
4.7 CNN特征可视化(What are deep ConvNets learning?)
4.8 代价函数(Cost function)
4.9 内容代价函数(Content cost function)
4.10 风格代价函数(Style cost function)
4.11 一维到三维推广(1D and 3D generalizations of models)