[发明专利]基于深度学习的手语识别方法有效
申请号: | 201510523173.6 | 申请日: | 2015-08-24 |
公开(公告)号: | CN105205449B | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 韩红;焦李成;王伟;洪汉梯;张鼎;李阳阳;马文萍;王爽 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于深度学习的手语识别方法。其步骤为:(1)划分数据库样本集;(2)采集图像块,(3)白化数据;(4)训练稀疏自编码网络;(5)获得卷积特征图;(6)获得池化特征图;(7)训练分类器;(8)测试分类结果。本发明用反向传导算法,训练稀疏自编码网络,使得本发明在处理复杂背景数据时提高了识别率,本发明选取稀疏自编码网络的权值作为卷积核,通过卷积,获得卷积特征图,将有监督学习和无监督学习结合起来,减少了手工标注标签的人力和物力,本发明采用最大池化方法,获得池化特征图,减小特征维度,减小了手语识别任务的复杂性。 | ||
搜索关键词: | 基于 深度 学习 手语 识别 方法 | ||
【主权项】:
1.一种基于深度学习的手语识别方法,其特征在于,随机从数据中抽取10张有标签的图像,使用线性支持向量机来作为分类器;该方法的步骤包括如下:(1)划分数据库样本集;(1a)提取手语图像数据集中的手语图像,将所提取的手语图像调整成32×32像素的手语图像;(1b)将调整后的所有手语图像均分为两部分,分别作为手语图像的训练样本和测试样本;(2)采集图像块:对训练样本的每一张手语图像随机采集10张图像块;(3)白化数据:对每一张采集的图像块进行白化处理,得到白化后的图像块;所述的对每一张采集的图像块进行白化处理是按照如下步骤进行的:第1步,按照下式,分别计算每一张采集的图像块中每一个像素的均值:
其中,
表示每一张采集的图像块中每一个像素的均值,m表示图像块的数目,xoi表示第i个图像块,i∈[1,m],∈表示属于符号;第2步,用每个图像块减去均值,得到去均值化图像块;第3步,按照下式,计算图像块的奇异矩阵;
其中,U表示图像块的左奇异向量组成的矩阵,S表示图像块的奇异值元素组成的对角矩阵,V表示图像块的右奇异向量组成的矩阵,svd(·)表示奇异值分解操作,m表示输入图像块的数目,xg表示第g张去均值化图像块,g∈[1,m],∈表示属于符号;第4步,按照下式,对去均值化图像块进行去相关处理;
其中,y表示去相关处理后的图像块,U表示图像块左奇异向量组成的矩阵,S表示图像块的奇异值元素组成的对角矩阵,ε表示规则化参数,ε的取值范围为0.01~0.1,T表示转置操作,x表示去均值化图像块;(4)训练稀疏自编码网络:(4a)将白化后的图像块作为稀疏自编码网络的输入矩阵和目标矩阵;(4b)采用正态分布函数,随机初始化稀疏自编码网络的权值和偏置;所述的正态分布函数的均值为0,方差的随机取值范围为0.01~0.1;(4c)采用反向传导算法,更新稀疏自编码网络权值和偏置,得到稀疏自编码网络的权值;(5)获得卷积特征图;(5a)将训练样本和测试样本作为卷积的输入矩阵;(5b)按照稀疏自编码网络的权值排列顺序提取11×11大小的卷积核;(5c)采用卷积公式,对输入矩阵进行卷积,得到输入样本和测试样本的卷积特征图;(6)获得池化特征图;采用最大池化方法,对训练样本和测试样本的卷积特征图进行池化处理,得到训练样本和测试样本的池化特征图;(7)训练分类器;用训练样本的池化特征图训练线性支持向量机分类器得到分类模型;(8)测试分类效果;用分类模型对测试样本的池化特征图进行分类,得到测试样本的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510523173.6/,转载请声明来源钻瓜专利网。
- 上一篇:具有颜色渐变效果的二维码、生成方法与生成系统
- 下一篇:监管宠物的方法和装置