[发明专利]一种基于三维残差神经网络和视频序列的动态手语识别方法在审
申请号: | 201910282569.4 | 申请日: | 2019-04-09 |
公开(公告)号: | CN110110602A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 闵卫东;廖艳秋;熊鹏文;韩清;张愚;徐剑强;邹松;熊辛;汪琦 | 申请(专利权)人: | 南昌大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06T7/194 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 胡群 |
地址: | 330000 江西省*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频序列 手势 手语识别 神经网络 时空特征 残差 三维 测试数据集 有效地实现 模型检测 特征序列 视频帧 有效地 手语 分析 分割 分类 | ||
本发明提供了一种基于三维残差神经网络和视频序列的动态手语识别方法,所述方法提出了基于三维残差神经网络的新模型B3D ResNet,包括以下步骤:步骤1,在视频帧中,采用Faster R‑CNN模型检测手的位置,并从背景中分割出手;步骤2,利用B3D ResNet模型对输入的视频序列进行手势的时空特征提取和特征序列分析;步骤3,通过对输入的视频序列进行分类,可以识别手势,有效地实现动态手语识别。本发明通过分析视频序列的时空特征,可以提取有效的动态手势时空特征序列,从而达到识别不同手势的目的,并且在复杂或类似的手语识别上也获得了良好的性能。通过测试数据集的实验结果表明,本发明可以准确有效地区分不同的手语,以及相似的手势对。
技术领域
本发明涉及手语识别技术领域,具体为一种基于三维残差神经网络和视频序列的动态手语识别方法。
背景技术
手语识别是聋哑人与非聋哑人交流的一种有效技术,随着人机交互研究的不断深入,手语识别已成为一个热门话题。近年来,手语自动识别系统通过将手势转换为文本或语音,为人机交互创造了一种新的方式,这种技术可以通过计算机辅助技术来实现。目前,在这方面已经有许多成功的应用,如分配语言翻译、手语导师和特殊教育,这些都可以帮助聋哑人与他人进行流利的交流。另一方面,手语普遍是由一系列动作构成的,是一种具有相似特征的快速运动。因此,静态手语识别技术很难解决手语动作的复杂性和变化性问题。因此,研究动态手语识别技术是解决此类问题的有效方法。基于视觉的动态手势识别技术具有灵活性、可扩展性和低成本等特点,是当前手势交互技术研究的热点。然而,动态手语识别技术在解决身体背景下手指运动的复杂性问题方面也面临着挑战。另一个困难是如何从图像或视频序列中提取最有效的特征。此外,如何选择合适的分类器也是获得准确识别结果的关键因素。
为了帮助聋哑人在日常生活中进行正常的交流,越来越多的研究者致力于改善上述问题,在动态手语识别方面已经取得了许多成果。解决动态手语识别问题的方法主要有两种:一种是基于手势形状和运动轨迹的识别方法,另一种是基于手语视频序列的识别方法。
在传统的动态手语识别中,主要利用手势的形状特征和运动轨迹特征来识别手势。但是这些特征不能完全满足实际动态手语识别的要求。随着深度学习理论的迅速发展,数据驱动方法在目标检测和手势识别方面表现出了突出的优异性。与基于手势形状和运动轨迹的手语识别方法不同,基于视频序列的手语识别能够充分利用时间信息,与整个场景相比,手的尺寸相对较小,因此手语动作的有效空间特征会被不相干信息所覆盖。因此,同时学习手语动作的时空特征将会是动态手语识别的一种有效方法。
发明内容
本发明的目的在于提供一种基于三维残差神经网络和视频序列的动态手语识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于三维残差神经网络和视频序列的动态手语识别方法,所述方法提出了基于三维残差神经网络的新模型B3D ResNet,包括以下步骤:
步骤1,在视频帧中,采用Faster R-CNN模型检测手的位置,并从背景中分割出手;
步骤2,利用B3D ResNet模型对输入的视频序列进行手势的时空特征提取和特征序列分析;
步骤3,通过对输入的视频序列进行分类,可以识别手势,有效地实现动态手语识别。
进一步的,所述采用Faster R-CNN模型检测手的位置的步骤如下:
(1)当图像序列输入卷积神经网络时,将会生成特征图,区域提议网络在以核大小为n×n的网络窗口在特征图上滑动;
(2)区域生成网络推荐候选区域,输出多个符合条件的候选区域;
(3)感兴趣区域池化层将不同大小的候选区域转换为固定长度的候选区域,然后输出固定长度的候选区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌大学,未经南昌大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910282569.4/2.html,转载请声明来源钻瓜专利网。