[发明专利]动态手势识别方法、装置、电子设备及可读存储介质有效
申请号: | 202110944939.3 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113392820B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 毛凤辉;郭振民;孙其民;李建军 | 申请(专利权)人: | 南昌虚拟现实研究院股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 周献 |
地址: | 330000 江西省南昌市红谷*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 手势 识别 方法 装置 电子设备 可读 存储 介质 | ||
1.一种动态手势识别方法,其特征在于,所述方法包括:
获取训练集,所述训练集包括正样本训练集和负样本训练集,所述正样本训练集为包括动态手势的多帧图像,所述负样本训练集为不包括动态手势的多帧图像;
基于所述正样本训练集和所述负样本训练集对初始yolov5模型进行训练,直至所述初始yolov5模型收敛,将收敛后的初始yolov5模型作为目标检测模型;
获取连续的多帧待识别图像;
通过所述目标检测模型从所述连续的多帧待识别图像中确定出连续的多帧目标图像,所述目标图像为包括预设定的动态手势的起始手型的图像,所述连续的多帧目标图像包括第一目标图像、第二目标图像以及第三目标图像;
基于所述第一目标图像和所述第二目标图像各自对应的边界框的位置属性,得到第一位置属性,所述第一位置属性为所述第一目标图像和所述第二目标图像对应的目标边界框对应的位置属性;
基于所述第二目标图像和所述第三目标图像各自对应的边界框的位置属性,得到第二位置属性,所述第二位置属性为所述第二目标图像和所述第三目标图像对应的目标边界框对应的位置属性,所述目标图像对应有所述动态手势的边界框,以及所述边界框的位置属性;
基于所述目标边界框对应的位置属性,获取所述连续的多帧目标图像各自对应的子图像,所述子图像为对所述目标图像进行分割后得到的图像,包括:获取第一子图像和第二子图像,所述第一子图像为基于所述第一位置属性获取的所述第一目标图像对应的子图像,所述第二子图像为基于所述第一位置属性获取的所述第二目标图像对应的子图像;获取第三子图像和第四子图像,所述第三子图像为基于所述第二位置属性获取的所述第二目标图像对应的子图像,所述第四子图像为基于所述第二位置属性获取的所述第三目标图像对应的子图像;
获取相邻两帧目标图像各自对应的子图像对应的光流矢量,以判断所述连续的多帧目标图像所包括的动态手势是否运动;
若所述连续的多帧目标图像所包括的动态手势是运动的,确定所述连续的多帧目标图像中的第一目标图像为动态手势的起始帧。
2.根据权利要求1所述的方法,其特征在于,所述获取相邻两帧目标图像各自对应的子图像对应的光流矢量,以判断所述连续的多帧目标图像所包括的动态手势是否运动,包括:
对所述第一子图像和所述第二子图像进行灰度化处理,得到灰度化处理后的第一子图像和第二子图像;
通过目标函数获取所述灰度化处理后的第一子图像和第二子图像对应的光流矢量;
对所述第三子图像和所述第四子图像进行灰度化处理,得到灰度化处理后的第三子图像和第四子图像;
通过目标函数获取所述灰度化处理后的第三子图像和第四子图像对应的光流矢量;
基于所述灰度化处理后的第一子图像和第二子图像对应的光流矢量,和所述灰度化处理后的第三子图像和第四子图像对应的光流矢量,判断所述连续的多帧目标图像所包括的动态手势是否运动。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标边界框对应的位置属性,获取所述连续的多帧目标图像各自对应的子图像还包括:
对所述第一目标图像和所述第二目标图像进行手部区域分割,分别得到所述第一目标图像对应的第一参考图像和所述第二目标图像对应的第二参考图像,所述第一参考图像为从所述第一目标图像中分割出的包括手部区域的图像,所述第二参考图像为从所述第二目标图像中分割出的包括手部区域的图像;
基于所述第一位置属性,获取所述第一参考图像对应的子图像;
基于所述第二位置属性,获取所述第二参考图像对应的子图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌虚拟现实研究院股份有限公司,未经南昌虚拟现实研究院股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110944939.3/1.html,转载请声明来源钻瓜专利网。