姿态概述
-
什么是人体姿态估计?
从给定的图像中识别人脸、手部、身体等关键点,即输入图像I,输出为所有关键点的像素坐标,这里J为关键点的总数(取决于具体的关键点模型),例如人脸68关键点,手势21关键点,人体18关键点等等。
-
不仅可以做2D姿态估计,还可以有3D姿态估计
-
下游任务
行为识别:PoseC3D(基于人体姿态识别行为动作)
CG、动画:通过表情姿态驱动一个动画做很多有趣的动作。
人机交互:通过手势识别手来控制物体。
动物行为分析
2D姿态估计
任务描述:
2D人体姿态估计:在图像上定位人体关键点(通常为人体主要关节)的坐标,即输入图像I,输出预定义关键点的坐标。
基本思路有两种:
1.基于回归:回归关键点的坐标
2.基于热力图:预测关键点位于每个位置的概率,即,其中

本文介绍了人体姿态估计的概念,包括2D和3D姿态估计,从基于回归的方法到热力图方法,如DeepPose、RLE和OpenPose。还探讨了多人姿态估计的自顶向下和自底向上方法,以及最新进展如PRTR和TokenPose。此外,讨论了3D姿态估计的评估指标,如PCP和PCK。
1224

被折叠的 条评论
为什么被折叠?



