论文笔记 Hrnet

High-Resolution Representations for Labeling Pixels and Regions

架构

如图1所示,HRnet的架构由四级组成,第2、第3和第4级由重复的 多分辨率</br>模块组成。每个多分辨率模块由多分辨率组卷积组成。多分辨率卷积如图2(a)和(b)组成。多分辨率卷积组是组卷积的简单扩充,它将输入通道分成几个子通道,并对每个子通道中不同的空间分辨率进行一次常规卷积。

figure1.PNG
figure2.PNG

图2(b)描述了多分辨率卷积的架构,它利用类似常规卷积中的全连接的模式,将多个分支集合起来,如图2(c)所示。常规卷积能够被划分为多次的小卷积。输入通道和输出通道均被分成几个子通道。输入和输出子通道通过全连接的样式连接起来,每个连接也是一次常规卷积。输出通道的每个子通道是每个输入通道卷积输出后的集合。

不同之处有两点:(1)在多分辨率卷积中,每个子通道的分辨率是不同的。(2)在处理输入和输出通道之间的连接时,需要处理分辨率降低的问题。这一问题是通过2-strided 3x3的卷积进行。

改进

在最初的HRnetV1中,只有高分辨率的特征图被输出出来,如图3(a)所示。这意味着只有高分辨率子通道的信息被利用上了,其他通道的信息就被舍去了。


figure3.PNG

我们对此进行了简单有效的修改,也就是利用上低分辨率通道的信息,这使得多分辨率卷积被充分的利用上了。

我们对第分辨率的特征表示进行双线性上采样,然后将这些特征表示堆叠起来,如图3(b)所示。我们利用这一步骤估计分割特征图/面部基准点热力图。在目标检测的应用中,我们通过多层次的平均池化进行下采样,构建了一个多层次的特征图,如图3(c)所示。这两种改进分别称为HRNetV2和HRNetV2p。

实例化

我们对这一网络的实例化同HRNetV1相似。网络开始阶段的枝干上包含两个strided 3x3的卷积,并将分辨率降低1/4。第一级包含四个残差单元,每个单元由一个宽度为64的bottleneck组成,并跟随着一个3x3的卷积层,将特征图的宽度减小到C。第2、第3和第4级分别包含1,4,3个多分辨率模块。四个分辨率卷积层的宽度(通道数)分别是C,2C,4C,和8C。多分辨率组卷积的每个分支包含4个残差单元,每个分辨率下的每个单元包括两个3x3的卷积。

在语义分割和面部关键点识别领域,我们将输出特征进行混合,如图3(b)所示,混合通过1x1的卷积在四个分辨率下进行,产生15C维的特征表示。然后,我们把混合后每个点的特征传入到线性分类/回归器中,损失函数设为Softmax/MSE损失,进而预测分割图或者面部关键点热力图。对于语义分割,训练集和测试集的分割图通过双线性上采样4倍,达到输入图像的分辨率。对于目标检测,我们在组成特征金字塔之前,通过一个1x1的卷积将高分辨率的特征表示减少至256.

Deep High-Resolution Representation Learning for Human Pose Estimation

人体姿态估计,也就是,关键点检测,目的在于从尺寸为W\times H\times 3的图像I中检测K个关键点或者关键部位,如,眼球,手腕等。这种state-of-the-art方法这一问题转化为估计K个尺寸为W'\times H'的热力图,\{H_1,H_2,...,H_k\},每个热力图H_k表示第k个关键点的位置置信度。
![成。这些卷积单元具有并联单元之间的交换单元。

eqution2.PNG

其中,C^b_{sr} 代表第 S 级第 b 个模块中的第 r 个分辨率的卷积单元。
\epsilon^b_s 是对应的交换单元

figure1_2.PNG

图3阐述了交换单元,并展示了如下的搭配。在讨论为求简洁时省去了上标和下标。输入为s个特征图:{\{X_1,X_2,...,X_s\}},输出为s特征图:{\{Y_1,Y_2,...,Y_s\}},输入和输出的分辨率和宽度都一样。每个输出都是输入特征图的聚合,Y_k= \sum^s_{i=1}a(X_i,k)。不同级之间的交换单元具有额外的输出特征图Y_{s+1}:Y_{s+1}=a(Y_s,s+1)

函数 a(Y_s,s+1) 表示将X_i从分辨率i上采样或者下采样到分辨率k。使用 strided 3 \times 3 的卷积做下采样。对上采样,使用简单的最近邻域采样,紧跟一个 1 \times 1 的卷积进行通道对齐。如果 i=k,a(.,.) 是独一的连接,那么 a(X_i,k)=X_i

热力图估计

我们通过最后一个交换单元的高分辨率特征表示获得热力图的回归,这种做法通常很有效果。损失函数是通过比较理想热力图和实际热力图的均方差构建的。标准热力图是每个关键点的单个像素通过标准二维高斯滤波的结果。

网络实例

我们根据ResNet的设计规则,来设计每个分辨率的通道数和每一级的网络深度,以便进行关键点热力图估计。

主体网络包含四级,具有四个并联的子网络。网络的分辨率逐步递减为前一级的一半,宽度,也就是通道数加倍。第一级包含4个残差单元。和ResNet-50一样,每个单元由一个宽度为64的bottleneck跟随一个 3 \times 3 的卷积单元构成。卷积单元是为了将特征图的宽度减至C。第2、第3和第4级分别包含1、4和3个交换单元。一个交换单元包含4个残差单元。每个残差单元包含两个 3 \times 3 的卷积。总共有8个交换单元,也就是进行了八次多尺度融合。

在我们的实验中,进行了一个小网络和一个大网络,分别是: HRNet-W32和HRNet-W48,其中32和48分别代表最后三级高分辨率子网络的宽度。其他三个并联的子网络的宽度分别为,64,128,256和96,192,384。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,670评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,928评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,926评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,238评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,112评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,138评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,545评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,232评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,496评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,596评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,369评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,226评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,600评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,906评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,185评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,516评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,721评论 2 335

推荐阅读更多精彩内容