登录注册写文章

Transformer 名称的由来

Transformer 名称的由来

翻译自原文：https://blogs.nvidia.com/blog/what-is-a-transformer-model/

注意力机制（Attention）是 Transformer 的核心，以至于谷歌研究人员几乎将这一术语用作他们 2017 年模型的名称——几乎敲定。

“'注意力网络'（Attention Net）听起来平淡无奇。” Ashish Vaswani 表示（他自 2011 年便开始研究神经网络）。

团队中的高级软件工程师 Jakob Uszkoreit 提出了 “Transformer” 这一名称。

Vaswani 对此调侃道：“我辩称我们是在转换表示（transforming representations），但这不过是玩了个文字游戏。”

额外说明：“transforming representations” 指模型通过自注意力机制重构数据表示（如文本向量），这是 Transformer 的核心创新

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Unleashing Novel Data at Scale|凡凡私荐第9期
本期推荐一份与Deep Learning、NLP相关的资料，作者是Melissa Dell教授，曾获得2020年克...
凡有言说阅读 1,183评论 0赞 3
X-former:不止一面，你想要的Transformer这里都有
©原创作者|FLPPED 参考论文： A Survey of Transformers 论文地址： https:/...
NLP论文解读阅读 634评论 0赞 0
RATSQL(Relation-Aware Transformer)论文笔记
本issue记录RATSQL相关的内容 paper： https://arxiv.org/abs/1911.049...
一个迷人的昵称阅读 1,666评论 0赞 0
论文-Attention Is All You Need(Transformer)
1. 简称论文《Attention Is All You Need》简称Transformer，作者Ashish...
魏鹏飞阅读 3,398评论 0赞 1
注意力机制在情感分析中的应用前景
1.背景介绍情感分析，也被称为情感检测或情感识别，是自然语言处理（NLP）领域中的一个重要研究方向。它旨在通过对...
光剑书架上的书阅读 404评论 0赞 1

1赞2赞

赞赏

手机看全文