[发明专利]一种基于定位分类回归网络的多人物姿势检测方法在审
申请号: | 201810313810.0 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108564022A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 姿势 回归 姿势估计 姿势检测 锚点 分类 迭代估计 检测结果 真实人体 姿态估计 单独地 分类器 候选框 三维 集合 网络 | ||
本发明中提出的一种基于定位分类回归网络的多人物姿势检测方法,其主要内容包括:定位、分类、回归和迭代估计,其过程为,先通过在候选框中定位K个假设姿势类别的集合(表示为锚点姿势)来获得姿势建议,然后使用分类器对每个姿势建议进行评分,并针对每个定位单独地进行回归,通过计算锚点姿势特定回归,估计真实人体姿势和姿势建议之间的差异,最后通过对相邻姿态假设进行积分获得姿态估计。本发明通过对相邻的姿势假设进行积分来获得最终的姿势估计,提高了二维和三维姿势估计的性能,使检测结果更加准确可靠。
技术领域
本发明涉及姿势检测领域,尤其是涉及了一种基于定位分类回归网络的多人物姿势检测方法。
背景技术
人类姿势的识别和检测是机器视觉领域的一大研究热点,被广泛应用在人机交互、行为分析、多媒体应用和运动科学等领域。近年来,随着数码相机、智能手机、监控摄像头等的普及,数字相片和视频数据急剧增长,其中人类活动是这些数据中获得的最主要内容。有效处理和理解数据中的人类活动,将对人们的研究和记录等带来极大的方便。人类姿势的识别和检测可以通过结合语音输入和麦克风输入实现人机交互,增强玩家的游戏体验。通过对监控视频中的人物画面进行姿势检测,可以协助安保人员检测人员密集的公共场所中出现的危险行为、盗窃行为等,有效维护公共场所的安全和秩序。对于运动员和舞者,可以通过姿势检测技术记录相应姿势,通过大量数据记录和分析,总结出更具有针对性训练方法。然而现有方法仍然存在由于人物被图像边界部分遮挡、人与人之间互相遮挡而不能准确识别和检测的问题。
本发明提出了一种基于定位分类回归网络的多人物姿势检测方法,先通过在候选框中定位K个假设姿势类别的集合(表示为锚点姿势)来获得姿势建议,然后使用分类器对每个姿势建议进行评分,并针对每个定位单独地进行回归,通过计算锚点姿势特定回归,估计真实人体姿势和姿势建议之间的差异,最后通过对相邻姿态假设进行积分获得姿态估计。本发明通过对相邻的姿势假设进行积分来获得最终的姿势估计,提高了二维和三维姿势估计的性能,使检测结果更加准确可靠。
发明内容
针对由于人物被图像边界部分遮挡、人与人之间互相遮挡而不能准确识别和检测的问题,本发明的目的在于提供一种基于定位分类回归网络的多人物姿势检测方法,先通过在候选框中定位K个假设姿势类别的集合(表示为锚点姿势)来获得姿势建议,然后使用分类器对每个姿势建议进行评分,并针对每个定位单独地进行回归,通过计算锚点姿势特定回归,估计真实人体姿势和姿势建议之间的差异,最后通过对相邻姿态假设进行积分获得姿态估计。
为解决上述问题,本发明提供一种基于定位分类回归网络的多人物姿势检测方法,其主要内容包括:
(一)定位;
(二)分类;
(三)回归;
(四)迭代估计。
其中,所述的定位分类回归网络,人的姿势(p,P)被定义为2D姿势p(即图像中每个关节的像素坐标)和3D姿势P(即每个关节相对于身体中心的3D位置,以米为单位);考虑13个关节的姿势,假设给定一组固定的K个2D-3D锚点姿势,用{(ak,Ak)}k=1..K表示;在本方法中,它们是通过对大量姿态进行聚类,并将每个聚类的中心用作锚点姿态获得的。
进一步地,所述的定位分类回归,给定一幅图像,首先计算卷积特征;定位组件,在姿势检测的上下文中也称为姿态建议网络,输出姿势建议的列表;姿态建议由一组假设的锚点姿势候选位置组成;接下来,感兴趣区域(RoI)汇聚层聚合每个候选区域内的特征;在两个全连接层之后,网络被分成两个部分;分类分支估计每个位置的锚点姿势正确的概率;回归分支计算锚点姿势特定回归,估计真实人体姿势和姿势建议之间的差异;损失为以下三项损失的总和:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810313810.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数码相片提取荒漠植被盖度的方法
- 下一篇:指纹识别装置和显示设备