从代码学AI——AutoEncoder

本篇主要介绍自编码这一粗暴、有效的手段。

自编码是一个很有趣的思路,很容易被理解和接受,它替代了传统的特征提取过程(深度学习实际上也是替代这个过程,只不过二者方法不一样)

1.自编码采用的方式是先对源数据进行编码,即对元数据进行层层抽象

2.之后再利用抽象的数据进行数据还原,之后对比还原后的数据和源数据的差异性(计算还原误差,或者通用的叫法是损失值)

3.再针对损失值进行优化,使得还原后的损失尽量小。实际上可以理解为一个逼近的过程,就是通过另一种表示尽量模仿原来的数据,使得损失的信息尽量少。

这三步进行循环迭代直到达到预期的优化值或者达到迭代次数的上限。下面开始代码注解。

导入相关的函数和数据集

# -*- coding: utf-8 -*-

""" 
自编码的实例

在MNIST数据集上采用自编码进行手写体识别

使用数据集:http://yann.lecun.com/exdb/mnist/

源码链接:https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/autoencoder.py

"""
from __future__ import division, print_function, absolute_import

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

# 导入数据
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data", one_hot=True)

设置参数

# 参数
#步长 或学习速率
learning_rate = 0.01
#迭代多少次
training_epochs = 5
#批量大小
batch_size = 256
#迭代多少次打印一次结果
display_step = 1
examples_to_show = 10

# 网络参数
#第一层提取256个特征
n_hidden_1 = 256 
#第二层提取128个特征
n_hidden_2 = 128 
#输入数据28*28
n_input = 784 
# tf Graph input (only pictures)
#实际shape[256,784]
X = tf.placeholder("float", [None, n_input])

# 权重参数
# encoder_h1=[784,256]
# encoder_h2=[256,128]
# decoder_h1=[128,256]
# decoder_h2=[256,784]

权重和偏差的参数,包含编码(encoder和decoder两个过程)

weights = {
    'encoder_h1': tf.Variable(tf.random_normal([n_input, n_hidden_1])),
    'encoder_h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
    'decoder_h1': tf.Variable(tf.random_normal([n_hidden_2, n_hidden_1])),
    'decoder_h2': tf.Variable(tf.random_normal([n_hidden_1, n_input])),
}
#biase参数
#encoder_b1=[256]
#encoder_b2=[128]
#decoder_b1=[256]
#decoder_b2=[784]
biases = {
    'encoder_b1': tf.Variable(tf.random_normal([n_hidden_1])),
    'encoder_b2': tf.Variable(tf.random_normal([n_hidden_2])),
    'decoder_b1': tf.Variable(tf.random_normal([n_hidden_1])),
    'decoder_b2': tf.Variable(tf.random_normal([n_input])),
}

定义encoder层

# 构建Encoder层
def encoder(x):
    # 第一层编码采用sigmoid激活函数 即对WX+b的结果采用Sigmoid进行激活
    #x->[256,784],w->[784,256]
    #layer_1->[256,256]
    layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(x, weights['encoder_h1']),
                                   biases['encoder_b1']))
    # 第二层在第一层结果的基础上进行Sigmoid激活,即对WX1+b的结果进行Sigmoid激活,这里X1即为layer_1
    #layer_1->[256,256],w->[256,128]
    #layer_2->[256,128]
    layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, weights['encoder_h2']),
                                   biases['encoder_b2']))
    return layer_2

定义decoder层


# 构建decoder层
def decoder(x):
    # 对编码层的结果进行解码,这里相当于做一个反向的还原
    # x=layer_2->[256,128],w->[128,256]
    # 解码结果layer_1->[256,256]
    layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(x, weights['decoder_h1']),
                                   biases['decoder_b1']))
    # 对上面的结果进行再次解码
    # w->[256,784]
    # 结果layer_2->[256,784] 相当于对图像做了一次还原
    layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, weights['decoder_h2']),
                                   biases['decoder_b2']))
    return layer_2

构建模型、定义优化方法、损失函数等

# 构造模型
#先编码
encoder_op = encoder(X)
#再解码
decoder_op = decoder(encoder_op)

# 解码后的结果,就相当于是预测的结果
y_pred = decoder_op
# Targets (Labels) are the input data.
y_true = X

# 定义损失函数,这里采用误差平方的均值
cost = tf.reduce_mean(tf.pow(y_true - y_pred, 2))
# 采用RMS方法进行优化
optimizer = tf.train.RMSPropOptimizer(learning_rate).minimize(cost)

构建计算图

# 初始化变量
init = tf.global_variables_initializer()

# 开始构建Graph
with tf.Session() as sess:
    sess.run(init)
    #总共计算批次
    total_batch = int(mnist.train.num_examples/batch_size)
    # 总共进行20次循环迭代
    for epoch in range(training_epochs):
        # 遍历每个批次
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            # 迭代优化
            _, c = sess.run([optimizer, cost], feed_dict={X: batch_xs})
        # 这里if没什么意义,如果display_step不是1的话则有意义,表示多少次打印一次结果
        if epoch % display_step == 0:
            print("迭代次数:", '%04d' % (epoch+1),
                  "损失值=", "{:.9f}".format(c))

    print("优化完成")

测试效果

    # 在测试集上进行自编码的测试
    encode_decode = sess.run(
        y_pred, feed_dict={X: mnist.test.images[:examples_to_show]})
    # 线性化的对比测试结果Compare original images with their reconstructions
    f, a = plt.subplots(2, 10, figsize=(10, 2))
    for i in range(examples_to_show):
        a[0][i].imshow(np.reshape(mnist.test.images[i], (28, 28)))
        a[1][i].imshow(np.reshape(encode_decode[i], (28, 28)))
    f.show()
    plt.draw()
    plt.waitforbuttonpress()

今天就写到这里,未完待续

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,884评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,212评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,351评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,412评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,438评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,127评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,714评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,636评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,173评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,264评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,402评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,073评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,763评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,253评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,382评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,749评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,403评论 2 358

推荐阅读更多精彩内容