[发明专利]一种手语识别方法有效
申请号: | 201910426216.7 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110175551B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 张淑军;张群;李辉;王传旭 | 申请(专利权)人: | 青岛科技大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/764 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 邵新华 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种手语识别方法,包括:对手语视频所对应的视频序列进行频域变换,得到图像的相位信息;将相位信息和视频序列送入C3D卷积神经网络进行一次卷积并融合,形成特征信息;将所述特征信息送入深度卷积神经网络进行二次卷积和池化,并在池化过程中执行自适应学习池化算法,筛选出目标特征向量,送入全连接层输出分类结果。本发明将频域变换结合到深度学习算法中,利用频域变换提取出手语视频中的相位信息,辅助RGB空间信息,送入深度学习网络生成手语的特征,由此获得的特征更为本质、准确。通过在3D卷积神经网络模型的池化层加入自适应学习池化算法,可以挖掘到手语视频中更为抽象、高级的视频特征,得到更为精确的分类结果。 | ||
搜索关键词: | 一种 手语 识别 方法 | ||
【主权项】:
1.一种手语识别方法,其特征在于,包括:根据手语视频形成视频序列X;对所述视频序列X进行基于频域变换的图像处理,提取出相位信息;将所述相位信息和视频序列X分别送入C3D卷积神经网络进行一次卷积,并对卷积后得到的特征进行加权融合,形成融合后的特征信息;将所述融合后的特征信息送入3D ResNets深度卷积神经网络进行二次卷积和池化,并在池化过程中执行自适应学习池化算法,筛选出目标特征向量,送入3D ResNets深度卷积神经网络的全连接层,输出分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910426216.7/,转载请声明来源钻瓜专利网。
- 上一篇:页码识别容错编码的方法
- 下一篇:基于深度耦合自编码的人脸画像合成方法