[发明专利]一种手势识别方法及相关设备在审
申请号: | 202111329923.8 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114170676A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李兆冉 | 申请(专利权)人: | 岚图汽车科技有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N3/08;G06N3/04;G06F3/01;G06V10/774;G06V10/82 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 查薇 |
地址: | 430000 湖北省武汉市武汉经济技*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手势 识别 方法 相关 设备 | ||
本发明公开了一种手势识别方法及相关设备。该方法包括:获取图像数据;获取手势图像数据;利用卷积神经网络模型对手势图像数据中的手势进行识别,其中,卷积神经网络模型是基于扩充训练图片训练得到的,扩充训练图片包括平移图片、旋转图片、缩放图片和剪切图片中的至少一种。本申请的实例通过合理的设计卷积层,池化层,全连接层之间的排列顺序,以及合理地选择每层神经网络的激活函数和卷积核的尺寸,并通过包括平移图片、旋转图片、缩放图片和剪切图片在内的扩充训练图片对模型进行训练,可以减少对于手势位置远近、方向、图像的背景和光照条件对于识别结果的影响。此模型训练速度快,能够对车辆中不同用户,在不同使用场景下的手势有很好的识别效果。
技术领域
本说明书涉及图像识别领域,更具体地说,本发明涉及一种手势识别方法及相关设备。
背景技术
随着汽车智能化的程度越来越高,车机的功能也越来越丰富。现如今大多数的新车上都配备了诸如观看视频,播放音乐,查看照片等功能。且随着功能的增多,车机系统的交互页面层级也越来越深,越来越复杂。以播放音乐为例,用户在使用过程中需要在屏幕上频繁点击:上一首,下一首,调高/调低音量,进入下一页,返回上一页等按钮。用户操作时需要手脑并用,这无疑会影响行车安全。由于操作车机而造成车祸的新闻也并不少见。因此,许多汽车厂家开发了手势控制功能,借助用户的手势采取非接触的方式控制车机系统。
现有的解决方案是在一个通用的图像识别算法模型上输入手势照片进行学习后形成一个手势识别的算法模型。以目前使用的模型为例,虽然该模型已经为了在移动端设备上运行已经进行了简化,其仍然拥有超过300万个参数。这样带来的一个明显弊端就是需要花费大量的时间和计算资源来进行训练,并且在部署在行动端的时候占用空间较大。此外,这种模型往往要求输入数千张具有较高的分辨率的图像才能达到理想的训练效果,而采集这些图像需要花费大量的工作量。同时因为保密要求,这种数量级的图像的存储,转移工作也较为繁琐。最后,数千数量级的图像并不足以支撑图像的增广操作,从而导致训练模型容易出现过拟合,通用性不佳的问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
为至少部分地解提高模型训练速度并提高模型识别精度的问题,第一方面,本发明提出一种手势识别方法,上述方法包括:
获取手势图像数据;
利用卷积神经网络模型对上述手势图像数据中的手势进行识别,其中,上述卷积神经网络模型是基于扩充训练图片训练得到的,上述扩充训练图片包括平移图片、旋转图片、缩放图片和剪切图片中的至少一种。
可选的,上述平移图片包括水平平移图片和竖直平移图片。
可选的,上述扩充训练图片的平移、旋转、缩放和剪切参数是基于上述车辆的驾驶舱内场景确定的。
可选的,上述优化卷积神经网络模型包括二维卷积层、最大池化层、一维展开层和全连接层。
可选的,上述扩充训练图片为黑白图片。
可选的,上述扩充训练图片采用加密压缩算法储存。
可选的,上述扩充训练图片的大小为32×32像素。
第二方面,本发明还提出一种手势识别装置,包括:
获取单元,用于获取手势图像数据;
识别单元,用于利用卷积神经网络模型对上述手势图像数据中的手势进行识别,其中,上述卷积神经网络模型是基于扩充训练图片训练得到的,上述扩充训练图片包括平移图片、旋转图片、缩放图片和剪切图片中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岚图汽车科技有限公司,未经岚图汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111329923.8/2.html,转载请声明来源钻瓜专利网。