迁移学习简介

简介

比如我们已经会编写Java程序,就可以类比着来学习C++,都是面向对象的语言,就很快学会了,或者在学会骑自行车之后,骑摩托车也自己比较容易了,因为这两种交通工具有许多相似之处。迁移学习,总结起来就是说我们要帮助机器获得举一反三的能力。

几种分类
  • 基于实例的迁移:

    • 通过权重的分配,来分别作用到源域和目标域来进行迁移,关于什么是源域,什么是目标域,这里可以先不用细究,你就明白是两个不同的空间就行了,具体的概念,后面的部分会详细的进行概述
    • 举例:比如说在源域中有一个样本和目标域中的一个样本非常的相似,那么我们就可以加大此样本对应的权重。
  • 基于特征的迁移:

    • 将源域和目标域的特征变换到同一个空间。
    • 举例:比如说在两个域上的feature具有很大的区别,那么我们就可以通过将这两个域的feature变换到同样的空间,这个时候我们就可以很方便的研究这两个域上的相关内容和性质了。
  • 基于模型的迁移:

    • 通过源域和目标域的参数共享机制
    • 举例:这也是我们在做DL中用到最多的一个方法了,比如说,将pre-trained的模型拿过来,通过固定一些layer的parameters,修改部分layer的parameters得到最终的非常好的结果。
  • 基于关系的迁移:

    • 利用源域中某种一般性的逻辑关系进行迁移

几种具体迁移方法

介绍主要侧重于训练集有标记的方法,训练集无标记的方法仍需进一步学习

训练集目标集均有标记

微调

  1. conservative training
    conservative training

    此处的关键是确保参数变化不大,避免过拟合

  2. Layer transfer
    Layer transfer

    copy几层layer到新的模型,只训练没有被copy的层

    几种策略

    • 语音:往往copy最后几层,前几层从声音讯号到发音方式(主要需要迁移的部分),后几层与说话者无关系。
    • 图片:前面copy前面几层,前几层是检测最简单的特征(例如直线、曲线),泛用性较强,后几层往往包含更多抽象特征,需要迁移。

多任务学习

  • 可以共用输入:主要用于多层结构的学习共用前几层,后几层分别处理:
共用输入
  • 不可共用输入:共用中间几个layer
不可共用输入

常见的使用:

一个常用的例子

例如单语言翻译为多种语言,在训练中文时即便借鉴英文(或其他语言)的知识,也可带来训练速度的提升:

跨语言学习

渐进式神经网络(仍待提升)

所有的之前任务的网络,保留并且fix,每次有一个新任务就新建一个网络(一列)。而为了能使用过去的经验,他们同样也会将这个任务的输入输入进所有之前的网络,并且将之前网络的每一层的输出,与当前任务的网络每一层的输出一起输入下一层。

渐进式神经网络

目前看来仍有较大的局限性,需要有相同的input feature

目标集无标记

Domain-adversarial learning

可以消除掉domain之间的区别

方法:在提取完Feature之后,增加一个domain classifier,再交给最后的classifier

我们希望特征可以尽可能的混合在一起

希望样本特征可以均匀分布

此处和GAN有关(不太了解)

结构大致如下:

网络结构

feature extractor不仅要尝试骗过domain classifier,还要(保留足够特征)满足label predictor的需要。它要提取一个供B和P共享的feature,这个feature有两个目标:最小化目标loss(帮助B);最大化二分类误差(对抗P)。Why?

所谓的domain adaption,其实也就是feature对于两个不同的域是自适应的,所以我们的这个feature尽可能让两个域区分不开,feature自己不就渐渐趋于域自适应了吗?

feature extractor希望将两个domain提取出来的feature尽可能的混合在一起。但是domain classifier却希望他能够尽可能的把从feature extractor中提取出来的feature划分到两个domain中。所以增加一个负向梯度优化提供给domain classifier,DC必须努力不能被骗过,否则就无法优化FE的特征提取能力。

负向梯度优化

zero-shot learning(零次学习)

希望模型能够对其从没见过的类别进行分类,让机器具有推理能力,实现真正的智能。其中零次(Zero-shot)是指对于要分类的类别对象,一次也不学习。

用attributes表示每一个类,标记每种类型有哪些特性,需要有足够的attributes,它的维度是固定的,它包含了能够较充分描述数据集中类别的属性。

经过神经网络之后,输出对应的特征,然后进行查表。

假设我们的模型已经能够识别马,老虎和熊猫了,现在需要该模型也识别斑马,那么我们需要告诉模型,怎样的对象才是斑马,但是并不能直接让模型看见斑马。所以模型需要知道的信息是马的样本、老虎的样本、熊猫的样本和样本的标签,以及关于前三种动物和斑马的描述。

attribute embedding
attribute embedding

让attribute embedding和word embedding尽可能的接近

假设目标函数是这个:

f*,g*=arg\min_{f,g}\sum_{n}||f(x^n) - g(y^n)||_2

不妨思考一下,这个公式合理吗?

显然是不合理的,因为这样可能会导致所有的向量都聚在一起,所以应该还要考虑和其他向量的距离:

f*,g*=arg\min_f,g\sum_n\max(0,k-f(x^n)g(y^n)+max_{m\neq n}f(x^n)g(y^m))

(k是自己定义的一个常量)

zero loss:

k-f(x^n)g(y^n)+min_{m\neq n}f(x^n)g(y^m) < 0

(x^n)g(y^n)-max_{m\neq n}f(x^n)g(y^m)>k

既要保证同类相近,又要保证不同的类尽可能的远

convex combination of semantic embedding
向量融合

lion和tiger概率相近,则将这两个的向量混合,查看他更接近哪一个word embedding

对比

测试图片 卷积神经网络 Domain-adversarial zero-shot

几种方法的对比

翻译的zero-shot learning

已知英文<->韩文,英文<->日文

可以做到韩文<->日文

语言encode进向量空间再decode:

一个向量空间的例子

可以发现多个语言的同一种意思会在同一块空间,也可以理解为机器“发明”了自己的语言

训练集无标记目标集有标记

self-taught learning

和半监督学习不同(但可以说相似)

学习如何提取源数据的更好的表示(无监督方法)

获取目标数据的更好表示

均无标记

self-taught Clustering

和普通的transfer learning不同

以后有机会学习一下

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354