2018年的这一次论文复现活动,我们收获了5份高质量作品,在假期即将到来之际,和大家一起重温。
2019年,我们将继续鼓励开发者们复现经典论文,促进AI行业的良性循环。
论文复现文章链接及简介:
PyraNet(2篇)
经典论文复现|手把手带你复现ICCV 2017经典论文—PyraNet
经典论文复现 | PyraNet:基于特征金字塔网络的人体姿态估计
Learning Feature Pyramids for Human Pose Estimation 是发表在 ICCV 2017 的工作,论文提出了一个新的特征金字塔模块,在卷积网络中学习特征金字塔,并修正了现有的网络参数初始方法,在人体姿态估计和图像分类中都取得了很好的效果。
[链接]
经典论文复现|手把手带你复现ICCV 2017经典论文—PyraNet
作者丨Dicint
学校丨北京信息科技大学
研究方向丨分割、推荐
经典论文复现 | PyraNet:基于特征金字塔网络的人体姿态估计
作者丨黄泽宇
学校丨深圳大学
研究方向丨计算机图形学、深度学习
图像超分辨率重建
单图像超分辨率重构(SR)可以从一张较小的图像生成一张高分辨率的图像。显然,这种恢复的结果是不唯一的。可以这样直观地理解:远远看到一个模糊的身影,看不清脸,既可以认为对面走来的是个男生,也可以认为这是个女生。那么,当我想象对面人的长相时,会如何脑补呢?
这就依赖于我们的先验知识。假如我认为,一个穿着裙子的人肯定是个女生,而对面那个人穿着裙子,所以我认为那是个女生,脑补了一张女神脸。然而,如果我知道穿裙子的人不一定是女生,还可能是女装大佬。迎面走来那个人瘦瘦高高,所以我认为十有八九是个男孩子,就会脑补一个……
也就是说,不同的先验知识,会指向不同的结果。我们的任务,就是学习这些先验知识。目前效果最好的办法都是基于样本的(example-based)。
[链接]
作者丨Molly
学校丨北京航天航空大学
研究方向丨计算机视觉
LSGAN
近几年来 GAN 是十分火热的,由 Goodfellow 在 14 年发表论文Generative Adversarial Nets[1] 开山之作以来,生成式对抗网络一直都备受机器学习领域的关注,这种两人零和博弈的思想十分有趣,充分体现了数学的美感。从 GAN 到WGAN[2] 的优化,再到本文介绍的 LSGANs,再到最近很火的BigGAN [3],可以说生成式对抗网络的魅力无穷,而且它的用处也是非常奇妙,如今还被用在例如无负样本的情况下如何训练分类器,例如AnoGAN [4]。
LSGANs 这篇经典的论文主要工作是把交叉熵损失函数换做了最小二乘损失函数,这样做作者认为改善了传统 GAN 的两个问题,即传统 GAN 生成的图片质量不高,而且训练过程十分不稳定。
[链接]
作者丨文永亮
学校丨华南理工大学
研究方向丨目标检测、图像生成
InfoGAN
生成对抗网络(Generative Adversarial Nets)是一类新兴的生成模型,由两部分组成:一部分是判别模型(discriminator)D(·),用来判别输入数据是真实数据还是生成出来的数据;另一部分是是生成模型(generator)G(·),由输入的噪声生成目标数据。
然而当我们遇到存在潜在的类别差别而没有标签数据,要使 GAN 能够在这类数据上拥有更好表现,我们就需要一类能够无监督地辨别出这类潜在标签的数据,InfoGAN 就给出了一个较好的解决方案。
[链接]
作者丨黄涛
学校丨中山大学数学学院18级本科生
研究方向丨图像识别、VQA、生成模型和自编码器