本周学习
human3.6M
Human3.6M数据集有360万个3D人体姿势和相应的图像,共有11个实验者(6男5女,论文一般选取1,5,6,7,8作为train,9,11作为test),共有17个动作场景,诸如讨论、吃饭、运动、问候等动作。该数据由4个数字摄像机,1个时间传感器,10个运动摄像机捕获。
不过该数据集需要校内网注册,还要经人工审核才能下载。
CMU panoptic dataset
该数据集是CMU大学制作,由480个VGA摄像头,30+HD摄像头和10个Kinnect传感器采集。
精度非常高,且粗粒度、细粒度都有覆盖。
panoptic
网络选择
由于以前看的论文已经没有参考性了,Openvino也就用不上了。打算直接从ResNet开始,看看经典网络效果。估摸着不会超过70%。基于Pytorch,比较容易,实现快速。
下周计划
Pytorch实现几种经典网络模型(AlexNet、ResNet等),对比效果。