登录注册写文章

在Seq2Seq和注意力机制中如何可视化模型细节

在Seq2Seq和注意力机制中如何可视化模型细节

参考： https://www.jianshu.com/p/df7906a2a28e

上面的参考博文中重点介绍了Bert的可视化后的结果，将 Bert 中的注意力机制通过Tensor2Tensor工具描述出来。

另外另一个开源库BertViz 有含有Transformer模型的各种模型更详细的可视化。

https://github.com/jessevig/bertviz

BertViz是用于可视化Transformer模型中注意力的工具，支持Transformer库中的所有模型（BERT，GPT-2，XLNet，RoBERTa，XLM，CTRL等）。

以GPT-2为例，Seq2Seq的注意力机制的部分可视化代码：

model_version = 'gpt2'

model = GPT2Model.from_pretrained(model_version, output_attentions=True)

tokenizer = GPT2Tokenizer.from_pretrained(model_version)

text = "The quick brown fox jumps over the lazy dogs."

inputs = tokenizer.encode_plus(text, return_tensors='pt', add_special_tokens=True)

input_ids = inputs['input_ids']

attention = model(input_ids)[-1]

input_id_list = input_ids[0].tolist() # Batch index 0

tokens = tokenizer.convert_ids_to_tokens(input_id_list)

call_html()

head_view(attention, tokens)

模型视图提供了所有模型层和头的注意力鸟瞰视图。

神经网络视图可视化查询和关键向量中的单个神经元，并显示如何使用它们来计算注意力。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

禁止转载，如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容

NLP的巨人肩膀（下）
本文上两篇系列 NLP的巨人肩膀（上） NLP的巨人肩膀（中） 4.6 Bidirectional Encoder...
weizier阅读 6,570评论 1赞 22
BERT Word Embeddings 教程
本篇文章译自 Chris McCormick的BERT Word Embeddings Tutorial 在这篇文...
夕宝爸爸阅读 26,507评论 1赞 13
辅食产业规模快速增长，四类产品份额超9成
据世界卫生组织，婴幼儿的肠胃发育大概要17周“才开始”逐渐成熟。6个月以后是给婴幼儿添加辅食的最佳时期。因此，国家...
在水一方品牌策划阅读 187评论 0赞 0
255:小世界到大世界
当我们因某事困扰，感到问题对我们来说是那么的难以解决，那么的困难，那么的沉重，如一座山压在我们心里，让我们...
Alice林阅读 318评论 0赞 0
你还紧紧握着青春不放手吗？
为了写这篇文，我特意脑补了一下“青春”这词，于是，我并不想解释，请看图。额(⊙o⊙)… 看完后，我感觉我用这个题...
染SE阅读 297评论 0赞 1

1赞2赞

赞赏

手机看全文