[发明专利]识别动态手势的方法在审
申请号: | 202110935352.6 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113723227A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 杨唤晨;徐杰;张宇;韩继泽 | 申请(专利权)人: | 山东云缦智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 刘德 |
地址: | 250101 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 动态 手势 方法 | ||
本发明提供了一种识别动态手势的方法,能够提高动态手势识别的正确率和泛化能力。一种识别动态手势的方法,包括以下步骤:人工神经网络模型的构造:人工神经网络模型的训练;使用训练好的神经网络模型识别用户动态手势。用TensorFlow、PyTorch、MXNet或其它任何框架构造人工神经网络,人工神经网络模型包括长短时记忆网络、全连接网络和输出层,其中,长短时记忆网络包含若干长短时记忆层,全连接网络包含若干全连接层和Dropout层。
技术领域
本发明涉及一种识别动态手势的方法,适用场景包括:使用动态手势遥控电视,使用动态手势操作电脑等等,属于信息技术领域。
背景技术
动态手势是指由一系列手势组成的动作序列,这个序列具有时间上的连续性。电子设备可以通过摄像头等图像采集装置,将动态手势作为图像序列或视频进行采集。手势是人类在日常生活中常用的交流手段,将手势用于人机交流,可以大大提高人机交流的方便性,提升用户体验。
过去,动态手势识别方法大多基于经典的HMM模型,或者结合卷积网络和LSTM。
发明内容
本发明目的是提供了一种识别动态手势的方法,能够提高动态手势识别的正确率和泛化能力。
本发明为实现上述目的,通过以下技术方案实现:
一种识别动态手势的方法,包括以下步骤:
S1.人工神经网络模型的构造:
S2. 人工神经网络模型的训练;
S3. 使用训练好的神经网络模型识别用户动态手势。
上述识别动态手势的方法基础上,其特征在于:用TensorFlow、PyTorch、MXNet或其它任何框架构造人工神经网络,人工神经网络模型包括长短时记忆网络、全连接网络和输出层,其中,长短时记忆网络包含若干长短时记忆层,全连接网络包含若干全连接层和Dropout层。
上述识别动态手势的方法基础上,人工神经网络模型的训练过程:
1)动态手势数据集包含N个样本,每个样本都是一个时长为t秒、长度为f帧的包含动态手势的图像序列或视频;
2) 动态手势数据集存储在外存储器上;
3)样本首先经过手关键点识别框架的处理,变成关键点坐标;
4)经过特征工程模块的处理,变成形状为f*m*2的特征张量;
5) 特征张量再输入至神经网络模块,优化器根据特征张量优化神经网络的参数,达到训练的目的;
6)经过多次迭代,得到训练好的神经网络模型。
上述识别动态手势的方法基础上,使用训练好的神经网络模型识别用户动态手势的过程:
1)摄像头采集用户手势的图像序列;
2)计算设备每隔ti秒对采集的视频做一次分割,每次分割出t秒的子序列;
3)这若干个分割出的子序列被分别输入至后面的流程;
4)子序列首先经过手关键点识别框架的处理,变成关键点坐标;
5)关键点坐标输入至特征工程模块,变成特征张量;
6)训练好的模型对特征张量做若干变换,得到识别结果。
上述识别动态手势的方法基础上,人工神经网络模型包括依次是1层全连接层、1层Dropout层和紧接着的另一层全连接层;输出层采用Softmax层。
上述识别动态手势的方法基础上,特征工程模块对输入做下述处理:
a)将序列的每个元素里的所有关键点正投影至与图像采集装置的镜头主轴垂直的平面,元素的数据量由3*m减少至2*m;
b)将所有关键点做相同的旋转变换,使得手掌根部关键点至中指根部关键点的线段是竖直的;
c)将所有关键点做相同的平移变换,使手掌根部关键点成为坐标原点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东云缦智能科技有限公司,未经山东云缦智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110935352.6/2.html,转载请声明来源钻瓜专利网。