登录注册写文章

CS231N Lecture13: Generative Models

CS231N Lecture13: Generative Models

无监督学习的举例：1. K-means，2. PCA主成分分析（Principal Component Analysis，降维Dimensionality reduction），3. Autoencoders(Feature learning) 4. Density estimation

对于输入数据，有一个重构的数据作为输出。

有监督学习VS无监督学习

生成模型

已知训练数据，从相同的分布中生成新的样本。

生成模型主要分为两类：一类是显式密度模型，另一类是隐式密度模型

1. PixelRNN and PixelCNN

显式密度模型：

PixelRNN，从角开始生成像素，依赖于之前的像素，用RNN或LSTM建模的。如下，缺点为序列生成是很慢的。

PixelRNN

PixelCNN，也是从角开始生成，依赖于之前的像素，用CNN建模的模型。如下，利用其周围的信息，输出是每个像素的softmax loss。与PixelRNN的训练速度一样，但是在生成的时候还是很慢。

PixelCNN

2. Variational Autoencoders (VAE)

Autoencoders是一个无监督学习的方法，可以对无标注的训练数据进行学习，学习低纬的特征表示。包含两部分，encoder是将输入映射到特征z，通常ecoder可以是一个线性层加非线性激活函数，也可以是一个全连接层，也可以是ReLU CNN。特征z的维数通常比x小，因为降维操作。为什么需要降维呢？z应该代表x中的重要特征，并且这些特征可以用于reconstruct original data。decoder与encoder的组成相似，ReLU CNN(upconv)，全连接，线性层加非线性激活函数。损失函数使用L2

问题：Intractability

z特征，取高斯先验概率

Decoder

问题在于，对于每个z无法计算这个积分：

解决方法：定义一个附加的encoder网络来近似p(z|x)。

3. GAN

不是通过显式的密度方程来做生成，而是利用基于游戏理论的方法，通过2-player游戏来训练分布。包含生成器和判别器

目标函数为：

三种方法的总结：

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

浅谈智能搜索和对话式OS
前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。这篇文章，甚至之后...
我偏笑_NSNirvana阅读 14,797评论 2赞 64
AlexNet论文翻译——中英文对照
声明：作者翻译论文仅为学习，如有侵权请联系作者删除博文，谢谢！翻译论文汇总：https://github.com...
SnailTyan阅读 14,294评论 1赞 27

学习笔记三
五、Deep Learning的基本思想假设我们有一个系统S，它有n层（S1,…Sn），它的输入是I，输出是O，...
dma_master阅读 5,726评论 1赞 2
BAT机器学习面试1000题系列（二）
101.深度学习（CNN RNN Attention）解决大规模文本分类问题。用深度学习（CNN RNN Att...
大黄大黄大黄阅读 14,762评论 2赞 42
普吉岛攻略2
8月25日海岛一日游终于和心心念念的好朋友见面了 4个人一起出门的第一天特别喜欢和几个朋友一起旅游的感觉能...
西瓜呀233阅读 3,496评论 0赞 0

赞1赞

赞赏

手机看全文