登录注册写文章

Transformer

大鱼奔大江

Transformer

什么是Transformer

Transformer是基于Self-attention注意力机制的一种网络结构，同时其网络结构也沿用了seq2seq的主体结构，由Encoder-Decoder流程组成，包含了multi-head（多个self-attention并行堆叠而成）、加入了位置信息编码以及mask。

Transformer的目的

Transformer最早的提出是由google2017年的一篇论文《Attention is All your need》其提出的最初目的是为了解决RNN中串行输入、串行编解码导致的速度慢的问题，RNN要等上一个输入编码完成后，才能对下一个输入进行编码，同理，解码过程也是如此，所以，Transformer提出了一种并行的结构来解决该问题。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

transformer
简介 Transformer模型最早是由Google于2017年在“Attention is all you ne...
三方斜阳阅读 347评论 0赞 1
图解 Transformer
本文翻译自 : http://jalammar.github.io/illustrated-transformer...
张贤同学阅读 390评论 0赞 0
Vision Transformer阶段性总结 (2021.10)
0. 前言近两年学术界对Transformer在CV上的应用可谓异常青睐，这里重点强调学术界的原因是目前工业界还...
mrhalyang阅读 2,377评论 0赞 0
论文共读笔记（2）理解Transformer的三层境界--Attention is all y...
[TOC]@author by xubing 0x00、先导知识 0.1 Seq2Seq 0.2 Attentio...
徐卜灵阅读 4,497评论 0赞 3
NLP三大特征提取器全梳理：RNN vs CNN vs Transformer
姓名：韩宜真学号：17020120095 转载自：https://zhuanlan.zhihu.com/p/18...
d5cc63d9e177阅读 1,351评论 0赞 2

赞1赞

赞赏

手机看全文