[发明专利]手势识别方法、装置、设备及计算机可读存储介质在审
申请号: | 201911259417.9 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111160114A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 尹海波;金欢欢 | 申请(专利权)人: | 深圳数联天下智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 王广涛 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明实施例涉及图像处理技术领域,具体涉及一种手势识别方法、装置、设备及计算机可读存储介质。该方法包括:获取手势图像;对手势图像进行预处理,得到特征手势图像;通过手势识别模型中的特征提取层对特征手势图像进行空洞卷积处理,得到特征手势图像的输出特征,输出特征用于表征手势图像在多个维度的特征;对输出特征进行加权运算,得到多个加权结果,每一个加权结果对应一种手势类别;将加权结果进行归一化输出,得到手势图像属于每一种手势类别的概率;将概率的最大值所对应的手势类别作为手势图像所属类别。通过上述方式,本发明实施例实现了对手势图像的识别。
技术领域
本发明实施例涉及图像处理技术领域,具体涉及一种手势识别方法、装置、设备及计算机可读存储介质。
背景技术
图像识别是利用计算机对图像进行处理和分析,以识别图像中各种不同目标和对象的技术。
传统的视力检测方法需要医生的深度参与,医生需要指示视标,被测试者需要口答或使用手势指出医生指示的视标方向。传统的视力检测方法在测试过程中需要医生长时间陪伴,在被测试人群较为集中的场景中,需要耗费大量的人力资源和时间成本。
发明内容
鉴于上述问题,本发明实施例提供了一种手势识别方法、装置、设备及计算机可读存储介质,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种手势识别方法,所述方法包括:
获取手势图像;
对所述手势图像进行预处理,得到特征手势图像,所述预处理包括对所述手势图像进行中心裁剪,得到标准手势图像,以及,将所述标准手势图像转换为张量数据类型;
通过手势识别模型中的特征提取层对所述特征手势图像进行空洞卷积处理,得到所述特征手势图像的输出特征,所述输出特征用于表征所述手势图像在多个维度的特征;
对所述输出特征进行加权运算,得到多个加权结果,每一个加权结果对应一种手势类别;
将所述加权结果进行归一化输出,得到所述手势图像属于每一种手势类别的概率;
将所述概率的最大值所对应的手势类别作为所述手势图像所属类别。
可选的,所述特征提取层包括空洞卷积层、激活函数层和池化层,所述通过手势识别模型中的特征提取层对所述特征手势图像进行空洞卷积处理,得到所述特征手势图像的输出特征,包括:
通过所述空洞卷积层将所述特征手势图像与多个空洞卷积核进行卷积运算,得到多个空洞卷积特征图;
通过激活函数层对每一个空洞卷积特征图进行非线性运算,得到每一个空洞卷积特征图对应的非线性卷积特征图;
通过池化层对每一个非线性卷积特征图进行池化,得到每一个非线性卷积特征图的输出特征。
在一种可选的方式中,所述通过池化层对每一个非线性卷积特征图进行池化,得到每一个非线性卷积特征图的输出特征,包括:
将每一个所述非线性卷积特征图划分为多个区域;
将每一个区域的最大值作为所述区域的表征值,以得到所述输出特征。
在一种可选的方式中,在获取手势图像之前,所述方法还包括:
构建手势识别模型;
获取多个训练图像;
对每一个训练图像进行预处理,得到每一个训练图像对应的训练特征图像;
对每一个训练特征图像的类别进行标识,得到每一个训练特征图像的标识信息,同一类别的训练特征图像对应的标识信息相同,不同类别的训练特征图像对应的标识信息不同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳数联天下智能科技有限公司,未经深圳数联天下智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911259417.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种串口收发隔离抓包装置及方法
- 下一篇:一种永磁开关移动式电源