吴恩达深度学习-序列模型 3.1 基础模型

本节基本上是对前两个单元的一个回顾，我们记得之前介绍RNN基础模型的时候，假设输入与输出的对象个数不等时，会使用一个先输入，后输出的模型。

模型的前半部分用于解码，后半部分用于编码。这个模型在大部分的机器翻译当中运作的效果都不错，但是可能没有办法达到最精准的效果。

RNN还经常会被用于图像的描述，此时输入的变量就变成了一个图像。我们在图像输入端后面建立一个Alexnet，然后在最后保留一个4096的全展开层，把这个4096维的向量输入到一个RNN模型里，然后逐个得出图像的语言描述。

这两个模型在生成Y的时候，有一个注意点是，要把前面生成的Y值输入到下一个生成单元当中，这样才能让他受到前面一个词的影响。

这些基础模型的效果都还不错，但是没有办法达到非常地精准，如果需要进一步的改善模型，要做一些其他的工作。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。