吴恩达深度学习-序列模型 3.1 基础模型

本节基本上是对前两个单元的一个回顾,我们记得之前介绍RNN基础模型的时候,假设输入与输出的对象个数不等时,会使用一个先输入,后输出的模型。

模型的前半部分用于解码,后半部分用于编码。这个模型在大部分的机器翻译当中运作的效果都不错,但是可能没有办法达到最精准的效果。

RNN还经常会被用于图像的描述,此时输入的变量就变成了一个图像。我们在图像输入端后面建立一个Alexnet,然后在最后保留一个4096的全展开层,把这个4096维的向量输入到一个RNN模型里,然后逐个得出图像的语言描述。

这两个模型在生成Y的时候,有一个注意点是,要把前面生成的Y值输入到下一个生成单元当中,这样才能让他受到前面一个词的影响。

这些基础模型的效果都还不错,但是没有办法达到非常地精准,如果需要进一步的改善模型,要做一些其他的工作。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容