2020-08-26 简述Seq2seq的执行原理/过程

1 数据预处理阶段（添加特殊字符）

<PAD>主要用来进行字符补全，<EOS>和<GO>都是用在Decoder端的序列中，告诉解码器句子的起始与结束

<UNK>则用来替代一些未出现过的词或者低频词

2 encoder

直接lstm或者其他模型

3 decoder

对target数据进行处理
构造Decoder
在训练过程中，我们需要将我们的target序列作为输入传给Decoder端RNN的每个阶段，而不是使用前一阶段预测输出，这样会使得模型更加准确。TrainingHelper用于训练阶段，GreedyEmbeddingHelper用于测试阶段

Embedding
构造Decoder层
构造输出层，输出层会告诉我们每个时间序列的RNN输出结果
Training Decoder
Predicting Decoder
4 构建好了Encoder层与Decoder以后，我们需要将它们连接起来build我们的Seq2Seq模型

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

探索 Seq2Seq 模型及 Attention 机制
1 什么是 Seq2Seq ？ Seq2Seq 是一个 Encoder-Decoder 结构的神经网络，它的输入是...
DejavuMoments阅读 18,927评论 0赞 11
第四天-机器翻译,注意力机制和Seq2seq模型,Transformer
机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机...
LinuxLeeSinYY阅读 4,365评论 0赞 1

公益AI-TASK04-机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer
机器翻译及相关技术机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机...
Andrew_zjc阅读 3,287评论 0赞 0
机器翻译及相关技术注意力机制与Seq2seq模型 Transformer 2020-02-19
机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机...
allen成阅读 3,921评论 0赞 0
Seq2Seq、Attention、以及Transformer介绍
Seq2Seq(Sequence To Sequence) Seq2seq 由Google首次引入机器翻译。在此之...
leon_kbl阅读 6,387评论 0赞 1

赞1赞

赞赏

手机看全文