人脸自收集数据集辅助制作工具——人脸姿态数据标注

综述

我们在进行人脸属性识别深度学习算法研究过程中除了使用开源带标签的数据以外，都会根据具体使用场景与需求用到大量自收集的图像数据（开源/爬虫/自拍等），然这些数据一般是没有人脸对应属性标注标签的。而我们在研究人脸各种检测算法时最终训练需要的数据就是图像+标签，所以如何快速标注这些特定数据便是数据收集工作的重点。本文主要讲一下如何通过python工具辅助标注人脸姿态数据，在此做一个分享。

标注目标确定

待标注图片：带有人脸的照片（单人脸/人脸区域在整个图像的占比足够多/各种场景下的人脸）
标注属性：人脸3个方向旋转角度标注，偏航角yaw 左右转头（左+ 右-）俯仰角pitch 抬头低头（上+ 下-）翻滚角roll 左右歪头（左- 右+）（如下图所示）

pose
标签文件：txt文本
标注文本格式：

图片文件相对路径 yaw pitch roll
}

数据命名规范：图片文件根目录与标签文件同名（除后缀名以外）

辅助工具开发所需的关键技术

去坐标图像显示

实现功能：将图像正常显示在一个控件内，去除各种干扰显示
关键代码：

    # 显示待标记图片
    im = Image.open(img_path)
    plt.imshow(im)
    plt.xticks([])  # 去掉横坐标值
    plt.yticks([])  # 去掉纵坐标值
    plt.axis('off')
    plt.gca().xaxis.set_major_locator(plt.NullLocator())
    plt.gca().yaxis.set_major_locator(plt.NullLocator())
    plt.subplots_adjust(top=1, bottom=0, right=1, left=0, hspace=0, wspace=0)
    plt.margins(0, 0)
    plt.show()

待标注图像遍历处理

实现功能：遍历待标注图片，并逐一进行显示和标注操作
关键代码：

def MarkToolWithImg(wait_mark_image_root_path, output_label_txt_path):
    """
        根据图片标注并生成标签文件
        :param wait_mark_image_root_path: 待标记图片根目录路径
        :param output_label_txt_path:  输出标签路径
        :return:
    """
    for parent, dirnames, filenames in os.walk(wait_mark_image_root_path):
        for filename in filenames:
            img_path = os.path.join(parent, filename)
            # 消重
            f = open('Face_data_mark.log', 'rb')
            a = f.readlines()
            matchObj = re.search(filename, "%s" % a, re.M | re.I)
            if matchObj:
                print(img_path + " 已标记过")
            else:
                print("正在标记：" + str(img_path))
                imgShowAndMark(img_path, output_label_txt_path, None)

def MarkToolWithTxt(label_txt_path):
    """
        根据标签文件定位图片并更新标注
        :param label_txt_path:  已标注标签路径
        :return:
    """
    with open(label_txt_path, 'r') as tt:
        while True:
            try:
                line = tt.readline()
                num = list(map(str, line.strip().split()))
                # 获取图片路径
                img_path = num.__getitem__(0)
                # 过滤已标注的行
                with open('Face_data_mark.log', 'r') as fdm:
                    markedLines = fdm.readlines()
                    fdm.close()
                current_img_name = os.path.basename(img_path)
                print(current_img_name)
                is_mark = False
                for c in markedLines:
                    if current_img_name.strip() in c:
                        print(img_path + " 已标注过")
                        is_mark = True
                if is_mark is False:
                    print("正在标注：" + str(img_path))
                    imgShowAndMark(img_path, label_txt_path, line)
            except Exception as e:
                print("标注结束：" + str(e))
                break
        tt.close()

待标注图像人脸姿态角度动态设置与保存

实现功能：判断待标注图片中人脸三个方向的姿态角度旋转情况，并可以通过手动输入标注3个方向的姿态角度（-90~90），并保存到标签文件中。
关键代码：

    if current_line != None:
        # 获取待标注目标行原信息
        global linelist
        with open(label_txt_path, 'r') as fr:
            linelist = fr.readlines()
            fr.close()
        # 待标注行信息
        global oldLine
        for line in linelist:
            if img_path in line:
                oldLine = line

        # 根据对比信息标注新的属性值
        newLine = myInput("请输入当前图片姿态 Yaw Pitch Roll 属性，已标注属性提示为：" + str(current_line))
        print("你输入的属性值为，{}！".format(newLine).strip())
        # 用新标注行替换原标注行
        replaceLine(label_txt_path, oldLine, newLine)
    else:
        newLine = myInput("请输入当前图片姿态 Yaw Pitch Roll 属性")
        print("你输入的属性为，{}！".format(newLine).strip())
        with open(label_txt_path, "a") as ot:
            ot.write(newLine)
            ot.close()
    # 插入对应标签文件指定行
    logging.info("已标记为：" + str(newLine).strip())

标注工具完整工程地址

PoseAnnotation

工具使用

待标注图片

标注信息

至此，我们的人脸姿态角度标注工具便开发完成了，完美解决了人脸姿态信息标注难的问题，极大提升了标注工作的效率，不知各位大佬是否还有其他更好的方法，欢迎评论区交流讨论。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,525评论 6赞 507
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,203评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,862评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,728评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,743评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,590评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,330评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,244评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,693评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,885评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,001评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,723评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,343评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,919评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,042评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,191评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,955评论 2赞 355