[发明专利]一种基于红外摄像头的静态手势识别方法有效
申请号: | 201811341659.8 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109508670B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 金展翌;张雄;樊兆雯;仲雪飞 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 张伟 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 红外 摄像头 静态 手势 识别 方法 | ||
本发明提供了一种基于红外摄像头的静态手势识别方法,属于红外(IR)图像的图像处理技术以及手势识别领域,该方法主要包括以下步骤:红外图像预处理;构建卷积神经网络,针对红外手势图像进行特征提取;根据分类权重占比,输出最终的手势分类。由于红外摄像头相比传统可见光摄像头获取图像的方式不再依赖外界环境光,本发明提供的基于红外摄像头的静态手势识别方法在无光、弱光以及不同场景的光照和背景噪声干扰下,均能够有效准确地提取手势特征,并进行准确的手势分类识别,输出正确的期望结果,且算法鲁棒性好。
技术领域
本发明涉及一种基于红外摄像头的静态手势识别技术,属于图像处理手势识别技术领域。
背景技术
随着人机交互日趋频繁及多样化,人们对人机交互的简单便捷性需求不断提升,传统的人机交互方式依赖鼠标、键盘越来越显出其局限性。而基于非接触式的手势识别,提供了一个更加自然、直接的人机交互接口,操作简单,灵活性高。且近些年随着传感器的发展,精准度与便携程度也大大提高,手势识别已经进入可用性阶段。
基于普通摄像头的手势识别依赖于环境光,一旦光线不足或者无光环境,则手势识别精确度下降甚至无法识别。同时,普通摄像头在复杂背景或近肤色背景下,手势特征提取效果差,影响最终的识别结果。与此相比,基于红外摄像头的手势识别应用场景更广。
基于卷积神经网络的模型与传统机器学习算法相比,省去了人为的特征工程,以集中方式解决问题,实现封闭式的端到端学习方式。同时,相比于传统神经网络通过共享权重减少了参数,体现了图像局部感知的思想。
发明内容
为解决上述问题,本发明公开了一种基于红外摄像头的静态手势识别方法,克服上述现有技术中的无法在光线不足环境或复杂背景实现手势识别、传统学习算法识别速度慢且检测精确度不高的缺点,提供了一种基于红外摄像头的静态手势识别方法,可以使手势识别在各种环境下实现快速、准确和高效的识别。
为了达到上述目的,本发明提供如下技术方案:一种基于红外摄像头的静态手势识别方法,包括如下步骤:
步骤1,卷积神经网络的训练;
步骤2,红外图像获取,读取红外摄像头的红外图像数据;
步骤3,图像预处理,放缩图像尺寸与卷积神经网络的输入相匹配,图像数据归一化;
步骤4,静态手势识别,卷积神经网络提取手势特征,归一化指数函数得出识别结果。
进一步的,所述步骤1中卷积神经网络的训练包括如下步骤:
步骤1-1,搭建卷积神经网络;
步骤1-2,制作训练样本集和测试样本集;
步骤1-3,利用样本集对搭建的卷积神经网络进行训练。
进一步的,所述步骤1-1中搭建卷积神经网络的结构:
基于2012年提出的AlexNet模型,该网络结构共有8层,前面5层是卷积层,后面3层是全连接层,最后一个全连接层的输出传递给softmax层,对应不同的分类标签。且在原始模型基础上采用小卷积核和Bottleneck操作代替原模型的大卷积核操作,以减少计算量,提升模型效率。
进一步的,所述步骤1-2中制作训练样本集和测试样本集包括如下步骤:
步骤1-2-1,采集10种单一背景下不同角度、不同人的红外手势图像;
步骤1-2-2,使用keras框架内置的ImageDataGenerator工具包对原始图像进行数据扩增,以避免小数据集带来的训练过拟合;
步骤1-2-3,将样本集随机打乱,以提升模型在测试集的预测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811341659.8/2.html,转载请声明来源钻瓜专利网。