stacked attention for VQA

论文 Stacked Attention Networks for Image Question Answering  将Visual  attention 机制应用到了  VQA  中,从整体来说,论文没有什么新颖的地方,也说明了以前的直接完全的 encoder-decoder 效果是不好的,很难capture到  fine details.    


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 今天是第二封信。我们一起走过的琐碎时光,温暖惬意。 贰 第二天开始军训了,严格的来说是操训。下午老师让在教室集合,...
    little蒹葭阅读 975评论 0 0
  • 关于理财,方式有很多,但是策略只有两点:本金和收益。 本金是通过努力工作,提升收入中获取,至于怎么获取?要么讨好上...
    财商大叔阅读 3,318评论 0 2
  • 网购的色粉到了,画了一幅人物,临摹的原画是油画,没有老师在身边指点,也尝试画了,而且胆子大了,不怕画坏,虽然很多细...
    蜗小简阅读 441评论 0 0