AutoEncoder训练

关于AutoEncoder

Deep learning:二十四(stacked autoencoder练习)

Sparse Autoencoder

AutoEncoder是多层神经网络,其中输入层和输出层表示相同的含义,具有相同的节点数。AutoEncode学习的是一个输入输出相同的“恒等函数”。不过输入和输出相同,使得这个网络的输出没有任何意义。AutoEncoder的意义在于学习的(通常是节点数更少的)中间coder层(最中间的那一层),这一层是输入向量的良好表示。这个过程起到了“降维”的作用。当AutoEncoder只有一个隐含层的时候,其原理相当于主成分分析(PCA),当AutoEncoder有多个隐含层的时候,每两层之间可以用RBM来pre-training,最后由BP来调整最终权值。网络权重更新公式很容易用求偏导数的方法推导出来,算法是梯度下降法。(RBM:层内无连接,层间全连接,二分图)

Denoising AutoEncoder是AutoEncoder的一个变种,与AutoEncoder不同的是,Denoising AutoEncoder在输入的过程中加入了噪声信息,从而让AutoEncoder能够学习这种噪声。

Denoising AutoEncoder与RBM非常像:

(1)参数一样:隐含层偏置、显示层偏置、网络权重

(2)作用一样:都是输入的另一种(压缩)表示

(3)过程类似:都有reconstruct,并且都是reconstruct与input的差别,越小越好

Denoising AutoEncoder与RBM的区别:

背后原理就不说了(RBM是能量函数),区别在于训练准则。RBM是隐含层“产生”显示层的概率(通常用log表示),Denoising AutoEncoder是输入分布与reconstruct分布的KL距离。所用的训练方法,前者是CD-k,后者是梯度下降。RBM固定只有两层;AutoEncoder,可以有多层,并且这些多层网络可以由标准的bp算法来更新网络权重和偏置,与标准神经网络不同的是,AutoEncoder的输入层和最终的输出层是“同一层”,不仅仅是节点数目、输出相同,而是完完全全的“同一层”,这也会影响到这一层相关的权值更新方式。总之,输入与输出是同一层,在此基础上,再由输入与输出的差别构造准则函数,再求各个参数的偏导数,再用bp方式更新各个权重。

【AutoEncoder工程代码】:相关Matlab工程代码主页:http://www.cs.toronto.edu/~hinton/MatlabForSciencePaper.html

论文:Science – 2006 Science_Reducing the Dimensionality of Data with Neural Networks

(如下所有文件,放到同一个目录下)

1). 下载手写体数据MNIST:http://yann.lecun.com/exdb/mnist/, 并在Linux或Windows下进行解压;(60,000 个训练集 和, 10,000 个测试集,数字手写体0-9 10类)

train-images-idx3-ubyte.gz: training set images (9912422 bytes)

train-labels-idx1-ubyte.gz: training set labels (28881 bytes)

t10k-images-idx3-ubyte.gz: test set images (1648877 bytes)

t10k-labels-idx1-ubyte.gz: test set labels (4542 bytes)

2). 下载共轭梯度代码:http://learning.eng.cam.ac.uk/carl/code/minimize/minimize.m

3). 下载AutoEncoder代码,包括如下13个Matlab文件:

mnistdeepauto.m //训练AutoEncoder的主文件;

mnistclassify.m //用于训练分类器的主文件;

converter.m //转换MNIST文件为Matlab数据格式;

rbm.m //训练RBM二进制隐层和二进制可视单元;

rbmhidlinear.m //训练RBM高斯隐层和二进制可视单元;

backprop.m //进行fine-tuning的反向传播代码;

backpropclassify.m //利用“Encoder”网络进行分类的反向传播;

CG_MNIST.m //Conjugate Gradient optimization for fine-tuning an autoencoder

CG_CLASSIFY_INIT.m //Conjugate Gradient optimization for classification (training top-layer weights while holding low-level weights fixed)

CG_CLASSIFY.m //Conjugate Gradient optimization for classification (training all weights)

makebatches.m //Creates minibatches for RBM training

mnistdisp.m //显示fine-tuning阶段的进度;

README.txt //说明文件

4). 在Matlab中执行mnistdeepauto.m文件训练autoencoder;我们看一下此文件中大致做了一些什么操作:

maxepoch=10; //RBM学习时的迭代次数

numhid=1000; numpen=500; numpen2=250; numopen=30; //设置各个隐藏层的神经元的个数;这个程序所采用的网络共有四层。【1000 500 250 30】

converter; \\作者提供的二进制数据需要将原始数据文件转换成Matlab数据格式

makebatches; \\把大的数据块拆成每块100个样本的小块 batchdata [样本数,维数,分块数]

//开始四层RBM训练

rbm; \\迭代学习,分别学习到4个RBM模型,mnisthp.mat, mnisthp2.mat, mnistpo.mat, mnistvh.mat记录了RBM学习到的模型(3个参数:权重矩阵W,前向偏移量b,后向偏移量c)

这里有一个问题,就是W,叫做链接权重矩阵可能更合适一点,如果叫做转移矩阵的话,一个问题就是,为什么P(v=1|h)=sigmod(c+Wv), 而P(h=1|v)=sigmod(b+W’h),这里W是用的转置而不是W的逆?因为直观上会有一个问题就是说 y=Wx的话,那么就应该有x=inv(W)y,但是这里确只是用一个转置,而且正交矩阵才具有此性质,W’=inv(W). 而其实 这个是RBM 能量函数的性质,在RBM能量函数中 v和h 有种伪对阵性,上述两式是在能量函数基础上计算条件概率得到的。

backprop; \\反向传播的训练速度好慢啊。==b,迭代200次估计需要1天多,我们直接迭代1次跑个demo,最终反向传播之后可以学习到 w1,w2,w3,w4四个编码权重矩阵及w5,w6,w7,w8四个解码权重矩阵。

5). 若执行mnistclassify.m可训练MNIST分类器

6). 代码中有很多参数可以进行调节You can also set various parameters in the code, such as maximum number of epochs, learning rates, network architecture, etc.

Q:DAE 比DBN 好?

【参考】:

1.http://blog.csdn.net/xceman1997/article/details/9392153

2.http://deeplearning.net/

3.http://www.cs.toronto.edu/~hinton/MatlabForSciencePaper.html

4. DeepLearning 工具包汇总http://blog.csdn.net/zouxy09/article/details/11910527

5. DeepLearning 工具包Matlab代码集合:https://github.com/rasmusbergpalm/DeepLearnToolbox,是丹麦工业大学以为硕士期间的工作

6. DeepLearning 工具包C, C++, Java, phython, scala代码集合,https://github.com/yusugomori/DeepLearning

7. RBM详解:http://ibillxia.github.io/blog/2013/04/12/Energy-Based-Models-and-Boltzmann-Machines/

【备注源码注释】:http://jacoxu.com/?p=692

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容

  • 查看原文 1 简介 Deep Learning最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身...
    JinkeyAI阅读 6,750评论 0 4
  • 第二个Topic讲深度学习,承接前面的《浅谈机器学习基础》。 深度学习简介 前面也提到过,机器学习的本质就是寻找最...
    我偏笑_NSNirvana阅读 15,597评论 7 49
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 5,073评论 0 8
  • 今天的心情不知道怎么形容,想买车的愿望很强烈,却有一种莫名的压力。 每天都在忙,忙啥呢?连买车的钱都没有,其实不是...
    N1115丁丽阅读 176评论 0 1
  • 我前世是你湖底的一条鱼 今生被你遗忘在沙漠里 不管我怎么挣扎 都无法回到你的心里 我每天汲取着晨露 吮吸着空气 我...
    瞿静阅读 758评论 0 1