[发明专利]动态手势识别方法和装置有效
申请号: | 201710501819.X | 申请日: | 2017-06-27 |
公开(公告)号: | CN107316022B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 王晓曼 | 申请(专利权)人: | 歌尔光学科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
地址: | 261061 山东省潍坊市潍坊高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 手势 识别 方法 装置 | ||
本发明公开了动态手势识别方法和装置,可以获取时间帧连续的多个手势图像,对每个手势图像划分为多个图像块,对每个图像进行傅里叶变换以及肤色判断变化,识别手势图像块和非手势图像块,然后根据相邻时间帧对应的手势图像中手势图像块和非手势图像块的标识值,对相邻时间帧对应的手势图像进行逻辑运算,并根据逻辑运算结果进行手势滑动的识别,由于该方法处理过程,不需要对整幅图像进行处理,且用逻辑运算简化及整合标识后多个图像块关系,可以快速准确地进行手势识别,也不需要占用大量的内存资源,大大提高手势识别的效率。
技术领域
本发明涉及人机交互技术领域,尤其涉及一种动态手势识别方法和装置。
背景技术
手势交互在人机交互技术领域中的重要性越发突出,在基于虚拟人机交互的场景中,主要通过手势来完成对虚拟界面上不同物体的抓取、移动并释放,因此,需要大量的动态手势来完成对物体的操作,为了保证动态手势识别的实时性,需要对动态手势进行快速准确的识别。
现有技术中,基于Tower算法来进行手势识别,其计算过程非常复杂,运算量超大,降低了手势识别的实时性。基于手势训练的手势识别,如果为了不占用大量内存则手势模型过于简单,造成手势识别准确率降低;如果为了保证手势识别准确率,需要对手势模型进行大量的训练,且增加的变量将占用大量的内存。
发明内容
为了解决上述问题,本发明提供一种动态手势识别方法和装置,可以快速准确地进行手势识别,而且算法简单,不需要占用大量的内存资源。
本发明提供一种动态手势识别方法,包括:
根据时间帧的先后顺序获取多个手势图像;
将每一个手势图像划分为预设个数的图像块;
从每个手势图像的图像块中,识别手势图像块和非手势图像块;
根据相邻时间帧对应的手势图像中手势图像块和非手势图像块的标识值,对相邻时间帧对应的手势图像进行逻辑运算,根据逻辑运算结果识别手势运动方向。
可选地,从每个手势图像的图像块中,识别手势图像块和非手势图像块,包括:
根据肤色范围区域,在每个手势图像的图像块中确定属于肤色范围区域的图像块;
对每个属于肤色范围区域的图像块进行傅里叶变换,确定该肤色范围区域的图像块的高频分量以及高频分量在对应图像块中的占比,其中高频分量表示图像中灰度变换速率大于预设阈值的图像区域;
若高频分量在对应图像块中的占比小于等于预设的占比阈值,则确定该肤色范围区域的图像块为手势图像块,否则确定为非手势图像块。
可选地,根据相邻时间帧对应的手势图像中手势图像块和非手势图像块的标识值,对相邻时间帧对应的手势图像进行逻辑运算,根据逻辑运算结果识别手势运动方向,包括:
将当前帧手势图像中手势图像块和非手势图像块的标识值与上一帧手势图像中手势图像块和非手势图像块的标识值进行逻辑运算得到第一运算结果值;
将当前帧手势图像中手势图像块和非手势图像块的标识值与下一帧手势图像中手势图像块和非手势图像块的标识值进行逻辑运算得到第二运算结果值;
将第一运算结果值与第二运算结果值进行比较,识别手势运动方向。
可选地,将当前帧手势图像中手势图像块和非手势图像块的标识值与上一帧手势图像中手势图像块和非手势图像块的标识值进行逻辑运算得到第一运算结果值,包括:
将当前帧手势图像中手势图像块和非手势图像块的标识值与上一帧手势图像中手势图像块和非手势图像块的标识值进行异或运算,得到第一异或运算值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔光学科技有限公司,未经歌尔光学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710501819.X/2.html,转载请声明来源钻瓜专利网。