卷积神经网络-第四周-吴恩达 Deep Learning Specialization 学习笔记

人脸识别(Face recognization)

人脸识别和人脸验证(Face verification)在本课中的区别是人脸识别是对应一个输入与多个可能的目标值的对应,例如输入一张图片,与数据库中的图片进行对比,从而输出与数据库中相匹配的照片的姓名;而人脸验证则是一个输入与一个输出之间的对应,例如输入一张图片和姓名,输出照片是否和姓名对应的判断结果。由于对于准确率要求更高,因此识别问题比验证问题更加困难。

One-shot 学习

人脸识别问题中一个重要的挑战是需要系统根据存储在数据库中的一张照片来判断新的输入是否与已有数据匹配。由于不能把同一个人的多张不同角度的照片作为输入信息来进行对比,因此系统需要学习一个函数关系来使得其能在少量数据的情况下表现出色。在这里可以定义一个“相似度”函数 d(img1, img2) 用以衡量两张照片的差异程度,当 d(img1, img2) ≤ τ 时可以认为两张图片上的人的身份相符,反之亦然,这里 τ 是一个超参数。

Siamese 网络

Siamese 的实现原理是通过训练使得网络可以将输入照片编码输出为一个向量,再将两张不同的照片输入由同一套参数构建的网络后将输出向量进行对比。例如对于两张输入照片 x(1)x(2),对应的网络输出是 f(x(1))f(x(2)),则 d(x(1), x(2)) 可以定义为 ||f(x(1)) - f(x(2)) ||22,用这个量的大小来衡量两张照片是否是同一个人。

Triplet 损失函数

为了可以通过相似度 d 的大小来进行人脸识别,网络的损失函数定义方法之一是采用 Triplet 损失函数:假设对于同一个基准输入,在这里称为 Anchor,将与之匹配的输入定义为 Positive,而对于与之不匹配的输入则定义为 Negative,由于对于一组照片来说总是同时考虑三个输入,所以称作 Triplet。

由于在网络训练过程中我们希望 ||f(A) - f(p)||22 - ||f(A) - f(N)||22 ≤ 0,即基准和匹配照片的差异值应该小于基准和不匹配照片的差异值,但如果网络通过训练将上式各项均设为 0 ,则结果也满足要求。因此可以定义一个超参数 α,称为误差限(margin),使得 ||f(A) - f(p)||22 + α - ||f(A) - f(N)||22 ≤ 0,即希望基准和匹配照片的差异值与基准和不匹配照片的差异值应至少为 α。

一个 Triplet 输入的损失函数可以定义为:

L(A, P, N) = max(||f(A) - f(p)||22 - ||f(A) - f(N)||22 + α, 0)

训练集的成本函数为:

J = ∑ L(A(i), P(i), N(i)),其中 i = 1, 2, 3,...,m

在实际训练中,训练数据集中的 (A,P,N) 对一般有多个,例如提供 10,000 张包含 1000 个个体的照片,而如果随机选择这些配对则有可能误差限 α 非常容易满足,因此需要在训练中选择比较难的配对方式。

二分法人脸识别

人脸识别实现中还可以通过一个 siamese 网络来将两张不同的照片输入编码成为向量后转换成二分问题,即相同取 1,不同取 0,此时的输出会变成:

ŷ = σ( ∑wi |f(x(i)k - f(x(j)k| + b), 其中 k 为特征向量的第 k 个元素,i, j 为两个不同的输入

上式中的相应元素之差的绝对值部分还可以变成 (f(x(i)k - f(x(j)k)2 / (f(x(i)k + f(x(j)k)

风格迁移

近几年比较流行的一个有趣的应用是使用神经网络来进行图画作品的风格迁移,而想要深刻理解和实施风格迁移就需要了解卷积神经网络每一个隐含层所学习到的内容。直观的理解就是神经网络随着层次的深入,其所能识别的模式愈加复杂,在初期只能识别简单的线条,而到了后期则可以逐渐识别一个完整的图片。

在实施风格迁移时,其成本函数的定义过程为:

  • 将需要做迁移的图片用 C, Content 来表示,而风格的来源则用 S, Style 表示,最终生成的图片用 G,Generated 来表示

  • 风格迁移的成本函数定义为 J(G) = α * Jcontent(C, G) + β * Jstyle(S, G),其中前半部分衡量两张图片内容的相似度,后半部分衡量两张图片风格的相似度,α, β 为各自的权重

  • 考虑到神经网络各层对于图片内容的识别程度,因此一般选择中间某层计算风格迁移的内容成本部分,越往前则对内容相似度要求越高。假设取在 l 层,如果内容图片和最终生成图片的激活函数为 a[ l ](C)a[ l ](G),则可以令 Jcontent(C, G) = ||a[ l ](C) - a[ l ](G)||22 通过比较两个激活向量每一个元素的差异的平方和来判断两者内容的相似度

  • 图片之间的风格比较则可以定义为不同通道间激活项的相关系数,也即不同通道之间特征的相关性:令 ai,j,k[ l ] 指代在 l 层高度为 i, 宽度为 j,通道为 k 位置的激活项,则可以构造两个 nC x nC 的风格矩阵 Gkk'[ l ](S) = ∑∑ai,j,k[ l ](S) ai,j,k'[ l ](S)Gkk'[ l ](G) = ∑∑ai,j,k[ l ](G) ai,j,k'[ l ](G),其中 i = 1, 2, 3,...,nHj = 1, 2, 3,...,nW,相应的成本函数则可以定义为 J[ l ]style(S, G) = ||Gkk'[ l ](S) - Gkk'[ l ](G)||22,在实际应用中为了使得最终的图片更加美观还可以进一步取多个层的成本函数的加和来进行风格比较 Jstyle(S, G) = ∑λ[ l ]J[ l ]style(S, G)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容