Realtime Multi-Person Pose Estimation

0.192

问题一 : head 和neck两个point在COCO dataset中是不存在的。通过设置关键点之间的推理关系,设定这两个点。

问题二 : 12个四肢point虽然看上去检测正确,但OKS很低,说明COCO与CHALLENGE AI的标注有差异,必须重新训练模型。

SSD并非影响关键,关键是keypoint模型的准确率低。

Baseline model: SSD + DeepLab 2017

(Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs)

0.196

问题 : 训练500k steps, loss 下降至0.9, 是否已经收敛? 从loss下降过程看,还在收敛中。

添加random mirror/random scale, 修改input size,以checkpoint继续训练。

0.266




Loss with steps

问题 : loss降低至0.09附近,是否还有下降空间? 继续训练200k steps未能继续大幅收敛。

问题 : 测试集中包含很多rotate sample,尝试0 90 180 270 四个vote决策结果

0.168

rotate+vote不适合dense feature决策过程

问题 : train与test的预处理过程有不同,一个是random sample, 一个是直接处理,既然加入了random mirror/mirror scale/pad,应当如何处理test的预处理过程?

修改image_reader, 严格映射feature map来得到每个point的hot map。

0.33

改换200k steps训练后的结果

0.347

问题 : 当前只有一个head,就是class,借鉴G_RMI添加offset的head,在checkpoint上fine tune。