[发明专利]一种深度图像中的姿势识别方法及装置有效
申请号: | 201410037994.4 | 申请日: | 2014-01-26 |
公开(公告)号: | CN103745218B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 王贵锦;何礼 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06T7/10 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李迪 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 图像 中的 姿势 识别 方法 装置 | ||
技术领域
本发明涉及图像处理技术领域,尤其涉及一种深度图像中的姿势识别方法及装置。
背景技术
姿势识别是人机交互的关键技术之一。目前主要是利用部件识别的方法识别出人体的各个部分,如四肢、头部等部分,再将各个部件连接起来构成人体姿势。但是仅仅利用部件检测的结果进行姿势识别往往丢失大量的人体结构信息,导致姿势识别结果不够理想,在由部件构件人体姿势的过程中引入概率图模型。然而,这种模型计算复杂度高,难以满足实时应用的要求。此外,在图像类型方面有两种,一种是彩色图像,另一种是深度图像。彩色图像容易受到光照、人体服饰的应用,影响姿势识别的性能;而深度图像表示的是采样点到摄像机之间的距离,可以更好地描述场景中景物的结构信息,因此可以提供更好的人体分割结构。本发明即利用深度图像通过结合随机森林和概率图模型提出了一种准确、稳定、实时的姿势识别方法。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是:现有技术中利用部件检测的结果进行姿势识别往往丢失大量的人体结构信息,导致姿势识别结果不够理想,在由部件构建人体姿势的过程中引入概率图模型,然而这种模型计算复杂度高,难以满足实时应用的要求。
(二)技术方案
为此目的,本发明提出了一种深度图像中的姿势识别方法,包括以下步骤:
从深度图像中提取人体三维轮廓;
计算所述三维轮廓的局部特征;
将所述三维轮廓的局部特征输入预设的人体结构模型,得到人体关节点的绝对空间分布和条件空间分布;
根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置,得到人体的姿势识别结果。
优选地,所述从深度图像中提取人体三维轮廓,具体包括:
实时采集输入场景的深度图像;
对所述深度图像进行前景分割得到人体前景图像;
采用局部极小值的方法从所述人体前景图像中提取人体三维轮廓。
优选地,所述计算所述三维轮廓的局部特征,具体包括:
以所述三维轮廓中某个点为中心,按照预设的比例将所述三维轮廓的三维空间划分成若干个同心球,并按照预设的角度将每一个同心球划分成若干段;
统计落在同心球中的所述三维轮廓的点的位置信息;
根据所述位置信息计算落在同心球中的所述三维轮廓的点的特征向量。
优选地,所述同心球的最外侧球的半径为三维轮廓中任意两个轮廓点之间相对距离的平均值。
优选地,所述人体结构模型为利用随机森林学习得到的。
优选地,所述根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置,得到人体的姿势识别结果,具体包括:
利用mean-shift算法在三维空间中计算每一个人体关节点的位置;
根据所述每一个人体关节点的位置得到人体的姿势识别结果。
此外,本发明还提供了一种用于在深度图像中进行姿势识别的装置,包括:
提取模块、第一计算模块、估计模块和第二计算模块;
提取模块,用于从深度图像中提取人体三维轮廓;
第一计算模块,用于计算所述提取模块提取的所述三维轮廓的局部特征;
估计模块,用于将所述三维轮廓的局部特征输入预设的人体结构模型,得到人体关节点的绝对空间分布和条件空间分布;
第二计算模块,用于根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置,得到人体的姿势识别结果。
优选地,所述提取模块包括:采集单元、生成单元和提取单元;
采集单元,用于实时采集输入场景的深度图像;
生成单元,用于对所述深度图像进行前景分割得到人体前景图像;
提取单元,用于采用局部极小值的方法从所述人体前景图像中提取人体三维轮廓。
优选地,所述第一计算模块包括:特征提取单元、统计单元和计算单元;
特征提取单元,用于以所述三维轮廓中某个点为中心,按照预设的比例将所述三维轮廓的三维空间划分成若干个同心球,并按照预设的角度将每一个同心球划分成若干段;
统计单元,用于统计落在同心球中的所述三维轮廓的点的位置信息;
计算单元,用于根据所述位置信息计算落在同心球中的所述三维轮廓的点的特征向量。
(三)有益效果
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410037994.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序