[发明专利]一种深度图像中的姿势识别方法及装置有效

申请号：	201410037994.4	申请日：	2014-01-26
公开（公告）号：	CN103745218B	公开（公告）日：	2017-02-15
发明（设计）人：	王贵锦;何礼	申请（专利权）人：	清华大学
主分类号：	G06K9/46	分类号：	G06K9/46;G06T7/10
代理公司：	北京路浩知识产权代理有限公司11002	代理人：	李迪
地址：	100084 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度图像中的姿势识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像处理技术领域，尤其涉及一种深度图像中的姿势识别方法及装置。

背景技术

姿势识别是人机交互的关键技术之一。目前主要是利用部件识别的方法识别出人体的各个部分，如四肢、头部等部分，再将各个部件连接起来构成人体姿势。但是仅仅利用部件检测的结果进行姿势识别往往丢失大量的人体结构信息，导致姿势识别结果不够理想，在由部件构件人体姿势的过程中引入概率图模型。然而，这种模型计算复杂度高，难以满足实时应用的要求。此外，在图像类型方面有两种，一种是彩色图像，另一种是深度图像。彩色图像容易受到光照、人体服饰的应用，影响姿势识别的性能；而深度图像表示的是采样点到摄像机之间的距离，可以更好地描述场景中景物的结构信息，因此可以提供更好的人体分割结构。本发明即利用深度图像通过结合随机森林和概率图模型提出了一种准确、稳定、实时的姿势识别方法。

发明内容

（一）要解决的技术问题

本发明所要解决的技术问题是：现有技术中利用部件检测的结果进行姿势识别往往丢失大量的人体结构信息，导致姿势识别结果不够理想，在由部件构建人体姿势的过程中引入概率图模型，然而这种模型计算复杂度高，难以满足实时应用的要求。

（二）技术方案

为此目的，本发明提出了一种深度图像中的姿势识别方法，包括以下步骤：

从深度图像中提取人体三维轮廓；

计算所述三维轮廓的局部特征；

将所述三维轮廓的局部特征输入预设的人体结构模型，得到人体关节点的绝对空间分布和条件空间分布；

根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置，得到人体的姿势识别结果。

优选地，所述从深度图像中提取人体三维轮廓，具体包括：

实时采集输入场景的深度图像；

对所述深度图像进行前景分割得到人体前景图像；

采用局部极小值的方法从所述人体前景图像中提取人体三维轮廓。

优选地，所述计算所述三维轮廓的局部特征，具体包括：

以所述三维轮廓中某个点为中心，按照预设的比例将所述三维轮廓的三维空间划分成若干个同心球，并按照预设的角度将每一个同心球划分成若干段；

统计落在同心球中的所述三维轮廓的点的位置信息；

根据所述位置信息计算落在同心球中的所述三维轮廓的点的特征向量。

优选地，所述同心球的最外侧球的半径为三维轮廓中任意两个轮廓点之间相对距离的平均值。

优选地，所述人体结构模型为利用随机森林学习得到的。

优选地，所述根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置，得到人体的姿势识别结果，具体包括：

利用mean-shift算法在三维空间中计算每一个人体关节点的位置；

根据所述每一个人体关节点的位置得到人体的姿势识别结果。

此外，本发明还提供了一种用于在深度图像中进行姿势识别的装置，包括：

提取模块、第一计算模块、估计模块和第二计算模块；

提取模块，用于从深度图像中提取人体三维轮廓；

第一计算模块，用于计算所述提取模块提取的所述三维轮廓的局部特征；

估计模块，用于将所述三维轮廓的局部特征输入预设的人体结构模型，得到人体关节点的绝对空间分布和条件空间分布；

第二计算模块，用于根据所述人体关节点的绝对空间分布和条件空间分布在三维空间中计算所述人体关节点的位置，得到人体的姿势识别结果。

优选地，所述提取模块包括：采集单元、生成单元和提取单元；

采集单元，用于实时采集输入场景的深度图像；

生成单元，用于对所述深度图像进行前景分割得到人体前景图像；

提取单元，用于采用局部极小值的方法从所述人体前景图像中提取人体三维轮廓。

优选地，所述第一计算模块包括：特征提取单元、统计单元和计算单元；

特征提取单元，用于以所述三维轮廓中某个点为中心，按照预设的比例将所述三维轮廓的三维空间划分成若干个同心球，并按照预设的角度将每一个同心球划分成若干段；

统计单元，用于统计落在同心球中的所述三维轮廓的点的位置信息；

计算单元，用于根据所述位置信息计算落在同心球中的所述三维轮廓的点的特征向量。

（三）有益效果

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410037994.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度图像中的姿势识别方法及装置有效

专利文献下载