[论文笔记]PCB_RPP_reID分析

论文和思路理解

行人重识别(Person Re-ID)【四】:论文笔记——Beyond Part Models: Person Retrieval with Refined Part Pooling 这篇写的很棒

简单地梳理一下主要思想

PCB(Part-based Convolutional Baseline)

image

这是个基础baseline,backbone使用的是resnet50, 到global average pooling之前完全一样。

  1. 假定输入是H,经过backbone之后得到三维的Tensor T
  2. 定义T中每个channel axis为column vectors, 即f
  3. 将T分成P个horizontal stripes(水平块),对p个horizontal stripes做Average pooling得到p个局部特征g
  4. 用1*1 conv降低g的维度到256维,为新的局部特征h
  5. 每个h经过一个全+分类器进行训练(分类器实质上是p个n分类的softmax, n为训练集的ID数目)

特点:减少降采样

训练:loss为交叉熵损失函数的sum(p个分类器,p个loss)

测试:串联向量g和h作为特征表示

Part内部信息不一致

这部分类似triplet loss或者像cornernet中的embedding

同一个part中的f应相似,不同part间应有差异

因此我们需要训练PCB到收敛后,测量f和g的相似程度(余弦距离),找到离每一个f最近的part,根据f的距离情况进一步改进

image

RPP(Rifined Part Pooling)

目标:解决上一模块说的要改进的东西,通过f和与其最相似的part来对齐所有f,让f回到自己属于的part去

具体做法:

  1. 测量f与每一个part的相似程度:S(f \leftrightarrow P_i)

  2. f根据S重采样到最相似的part上

  3. 重复1、2直到收敛

  4. 用p个classifier去预测 S(f \leftrightarrow P_i)的值,预测公式为
    S(f \leftrightarrow P_i) = softmax(w_i^Tf) = \frac{exp(w_i^Tf)}{\sum_{j=1}^{n}exp(w_j^Tf)}

PCB部分的第三步即可用上述RPP取代,即RPP后,得到每个part对应的attention map权值,后续的降采样等步骤一致。

如何训练RPP中calssifier的权重

这个权重就是上一部分第4步中的w

  1. 将图像等分,训练PCB至收敛
  2. 将T后面的Average pooling替换为一个p分类的part classifier
  3. 固定PCB其它层的参数,只训练part classifier至收敛
  4. 放开全部参数,fine tune

代码阅读

看了好几份代码,在最后检测部分都有点含糊。找到一份好像有点写清楚了,打算分析一下。

test.py

代码逻辑

  • 输入

    • gallery_XXs:候选行人的图像库

    • query_XXs:待查询输入

  • 输出

    • mAP
    • CMC
  • 步骤

    针对每一个query:

    • 去gallery_labels中找同label的索引
    • 去gallery_cams中找同cam的索引
    • postive_index: 找到不同cams下同一label的索引,即为正样本的索引(标注信息)
    • junk_index: 找到label==-1及同一cam下同一label的索引,即为无效的索引
    • sufficient_index: 找到所有有效的索引(所有index-junk_index)
    • y_true: 得到sufficient_index中的每一个图像是否是正样本(标注信息)
    • y_score: 预测得到的sufficient_index中的每一个的分值(预测信息)

    由此得到mAP和CMC

代码知识

  • setdiff1d(ar1, ar2, assume_unique=False)

    1.功能:找到2个数组中集合元素的差异。

    2.返回值:在ar1中但不在ar2中的已排序的唯一值。

    3.参数:

    • ar1:array_like 输入数组。

    • ar2:array_like 输入比较数组。

    • assume_unique:bool。如果为True,则假定输入数组是唯一的,即可以加快计算速度。 默认值为False。

  • numpy.intersect1d

    返回两个数组的交集,已排序的唯一值

  • numpy.append(arr,values,axis=None)

    就是往numpy数组中加数元素。和list.append()的区别在于:list.append()只能添加一个元素,而numpy.append()可以添加多个元素,Append values to the end of an array.

  • numpy.in1d(ar1, ar2, assume_unique=False, invert=False)

    Test whether each element of a 1-D array is also present in a second array.

    Returns a boolean array the same length as ar1 that is True where an element of ar1 is in ar2 and False otherwise.

  • sklearn.metrics.average_precision_score(y_true, y_score, average=’macro’, pos_label=1, sample_weight=None) source

    Compute average precision (AP) from prediction scores.

    AP summarizes a precision-recall curve as the weighted mean of precisions achieved at each threshold, with the increase in recall from the previous threshold used as the weight: \text{AP} = \sum_n (R_n - R_{n-1}) P_n

    where P_n and R_n are the precision and recall at the nth threshold.

    Retures: average_precision(float)

  • CMC曲线

    假如我们训练好了一个3分类的模型,分别为类别c1,c2,c3。每个样本输入模型后会得到对应的3个匹配分数,匹配分数最高的那个类别即是预测的类别数。

image

源码分析

# ---------------------- Evaluation ----------------------
# query:待查询输入,gallery:候选行人框
# query和gallery的features, labels, cams均为已知信息,features是通过网络提取到的特征
def evaluate(query_features, query_labels, query_cams, gallery_features, gallery_labels, gallery_cams):
    """Evaluate the CMC and mAP
    Arguments:
        query_features {np.ndarray of size NxC} -- Features of probe images
        query_labels {np.ndarray of query size N} -- Labels of probe images
        query_cams {np.ndarray of query size N} -- Cameras of probe images
        gallery_features {np.ndarray of size N'xC} -- Features of gallery images
        gallery_labels {np.ndarray of gallery size N'} -- Lables of gallery images
        gallery_cams {np.ndarray of gallery size N'} -- Cameras of gallery images
    Returns:
        (torch.IntTensor, float) -- CMC list, mAP
    """

    CMC = torch.IntTensor(len(gallery_labels)).zero_()
    AP = 0
    sorted_index_list, sorted_y_true_list, junk_index_list = [], [], []

    for i in range(len(query_labels)):
        # 对每一个要查询的图像,获取一下信息
        query_feature = query_features[i]
        query_label = query_labels[i]
        query_cam = query_cams[i]

        # Prediction score
        # 对要查询的图像获取一个score,但这个score为什么能这么获取没搞明白
        score = np.dot(gallery_features, query_feature)
        
        # 去gallery_labels里找和query_label相对应的数据索引(即找到这些数据在哪儿)
        match_query_index = np.argwhere(gallery_labels == query_label)
        # 去gallery_cams里找和query_cam相对应的数据索引(即找到这些数据在哪儿)
        same_camera_index = np.argwhere(gallery_cams == query_cam)

        # Positive index is the matched indexs at different camera i.e. the desired result
        # 在match_query_index中但不在same_camera_index中的已排序的唯一值
        positive_index = np.setdiff1d(
            match_query_index, same_camera_index, assume_unique=True)

        # Junk index is the indexs at the same camera or the unlabeled image
        # Junk index是同一camera下同一label的照片或未标注的图像,不要的索引
        junk_index = np.append(
            np.argwhere(gallery_labels == -1),
            np.intersect1d(match_query_index, same_camera_index))  # .flatten()

        index = np.arange(len(gallery_labels))
        # Remove all the junk indexs
        # 从gallery中去掉junk index的元素
        sufficient_index = np.setdiff1d(index, junk_index)

        # compute AP
        # y_true返回一个结果,判断sufficient_index中的每一个元素是否在positive_index中
        y_true = np.in1d(sufficient_index, positive_index)
        # y_score是根据特征算到的结果
        y_score = score[sufficient_index]
        # 用库函数算AP
        AP += average_precision_score(y_true, y_score)

        # Compute CMC
        # Sort the sufficient index by their scores, from large to small
        # sorted_index: y_score从大到小排序后得到的索引
        sorted_index = np.argsort(y_score)[::-1]
        # 与sorted_index排序一致的正负样本真实情况 
        sorted_y_true = y_true[sorted_index]
        # 得知sorted_y_true中哪些是正样本
        match_index = np.argwhere(sorted_y_true == True)
        
        # 累计CMC的值
        if match_index.size > 0:
            first_match_index = match_index.flatten()[0]
            CMC[first_match_index:] += 1

        # keep with junk index, for using the index to show the img from dataloader
        all_sorted_index = np.argsort(score)[::-1]
        all_y_true = np.in1d(index, match_query_index)
        all_sorted_y_true = all_y_true[all_sorted_index]

        sorted_index_list.append(all_sorted_index)
        sorted_y_true_list.append(all_sorted_y_true)
        junk_index_list.append(junk_index)

    CMC = CMC.float()
    CMC = CMC / len(query_labels) * 100  # average CMC
    mAP = AP / len(query_labels) * 100

    return CMC, mAP, (sorted_index_list, sorted_y_true_list, junk_index_list)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352