[发明专利]一种人手姿态估计方法及系统在审
申请号: | 201810771201.X | 申请日: | 2018-07-13 |
公开(公告)号: | CN108960178A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 王贵锦;陈醒濠;季向阳 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 姿态估计 迭代 手部 预设 深度图像 神经网络 特征图 人手 最大程度地 获取目标 输出目标 卷积 决策层 输出 | ||
本发明提供的一种人手姿态的估计方法及系统,其中方法包括:获取目标手部的深度图像,将深度图像输入至第一预设神经网络的卷积层,输出目标手部的特征图;将特征图和上一次迭代的姿态估计结果输入至第一预设神经网络的决策层,输出当前迭代的姿态估计结果;若当前迭代的姿态估计结果与上一次迭代的姿态估计结果间的偏差小于预设阈值,则将当前迭代的姿态估计结果作为目标手部的最终姿态估计结果。该方法及系统能够最大程度地提高姿态估计结果的准确性,解决了由于手指间的自相似性导致姿态估计结果不准确的问题。
技术领域
本发明涉及图像识别技术领域,更具体地,涉及一种人手姿态估计方法及系统。
背景技术
人手姿态估计问题指的是从图像中准确估计出人手骨架节点的三维坐标位置。这是计算机视觉和人机交互领域的一个关键问题,在虚拟现实、增强现实、非接触交互以及手势识别等领域有重要的意义。随着商用、低廉的深度相机的兴起和发展,基于深度图像的人手姿态估计算法成为了关注的热点。
现有的人手姿态估计方法通常分为三类:模型拟合方法,鉴别式方法以及混合方法。模型拟合方法利用优化方法把预定义好的手模型匹配到输入深度图像中。鉴别式方法则完全是数据驱动的方法,其目标是通过有标签的训练数据,学习出一个回归器,对输入的深度图像预测手的姿态信息。混合方法则是前述两种方法的结合,通常先通过鉴别式方法得到初始的估计,再利用模型拟合方法来对结果进行修正。
然而,由于手本身面积较小,在跟相机距离较远时深度图像的噪声较大;手自由度高,关节之间关系复杂,而且容易产生自遮挡现象;此外,手指本身也有较高的自相似性。以上这些问题导致现有的人手字条估计方法难以获得高精度的人手姿态估计结果。
有鉴于此,亟需提供一种人手姿态估计方法及系统,以有效提高人手姿态估计结果的精度。
发明内容
本发明为了克服现有的人手姿态估计方法难以获得高精度的人手姿态估计结果的问题,提供一种人手姿态估计方法及系统。
一方面,本发明提供一种人手姿态的估计方法,包括:
获取目标手部的深度图像,将所述深度图像输入至第一预设神经网络的卷积层,输出目标手部的特征图;
将所述特征图和上一次迭代的姿态估计结果输入至第一预设神经网络的决策层,输出当前迭代的姿态估计结果;
若当前迭代的姿态估计结果与上一次迭代的姿态估计结果间的偏差小于预设阈值,则将当前迭代的姿态估计结果作为目标手部的最终姿态估计结果。
优选地,所述输出当前迭代的姿态估计结果,之后还包括:
若当前迭代的姿态估计结果与上一次迭代的姿态估计结果间的偏差大于预设阈值,则将当前迭代的姿态估计结果作为上一次迭代的姿态估计结果输入至所述决策层。
优选地,所述决策层包括特征优化层和全连接层;
相应地,所述将所述特征图和上一次迭代的姿态估计结果输入至第一预设神经网络的决策层,输出当前迭代的姿态估计结果,具体为:
将所述特征图和上一次迭代的姿态估计结果输入至所述特征优化层,利用所述特征优化层根据上一次迭代的姿态估计结果从所述特征图中提取每个关节点对应的区域特征;
将所有关节点对应的区域特征输入至所述全连接层,输出当前迭代的姿态估计结果。
优选地,所述利用所述特征优化层根据上一次迭代的姿态估计结果从所述特征图中提取每个关节点对应的区域特征,具体为:
对于上一次迭代的姿态估计结果中的任意一个关节点,利用所述特征优化层在所述特征图中获取该关节点对应的投影点,以所述投影点为中心提取预设大小的区域特征,获得该关节点对应的区域特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810771201.X/2.html,转载请声明来源钻瓜专利网。