[发明专利]基于深度学习的手语识别方法有效

申请号：	201510523173.6	申请日：	2015-08-24
公开（公告）号：	CN105205449B	公开（公告）日：	2019-01-29
发明（设计）人：	韩红;焦李成;王伟;洪汉梯;张鼎;李阳阳;马文萍;王爽	申请（专利权）人：	西安电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	陕西电子工业专利中心 61205	代理人：	田文英;王品华
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了基于深度学习的手语识别方法。其步骤为：(1)划分数据库样本集；(2)采集图像块，(3)白化数据；(4)训练稀疏自编码网络；(5)获得卷积特征图；(6)获得池化特征图；(7)训练分类器；(8)测试分类结果。本发明用反向传导算法，训练稀疏自编码网络，使得本发明在处理复杂背景数据时提高了识别率，本发明选取稀疏自编码网络的权值作为卷积核，通过卷积，获得卷积特征图，将有监督学习和无监督学习结合起来，减少了手工标注标签的人力和物力，本发明采用最大池化方法，获得池化特征图，减小特征维度，减小了手语识别任务的复杂性。
搜索关键词：	基于深度学习手语识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度学习的手语识别方法，其特征在于，随机从数据中抽取10张有标签的图像，使用线性支持向量机来作为分类器；该方法的步骤包括如下：(1)划分数据库样本集；(1a)提取手语图像数据集中的手语图像，将所提取的手语图像调整成32×32像素的手语图像；(1b)将调整后的所有手语图像均分为两部分，分别作为手语图像的训练样本和测试样本；(2)采集图像块：对训练样本的每一张手语图像随机采集10张图像块；(3)白化数据：对每一张采集的图像块进行白化处理，得到白化后的图像块；所述的对每一张采集的图像块进行白化处理是按照如下步骤进行的：第1步，按照下式，分别计算每一张采集的图像块中每一个像素的均值：其中，表示每一张采集的图像块中每一个像素的均值，m表示图像块的数目，x_oⁱ表示第i个图像块，i∈[1,m]，∈表示属于符号；第2步，用每个图像块减去均值，得到去均值化图像块；第3步，按照下式，计算图像块的奇异矩阵；其中，U表示图像块的左奇异向量组成的矩阵，S表示图像块的奇异值元素组成的对角矩阵，V表示图像块的右奇异向量组成的矩阵，svd(·)表示奇异值分解操作，m表示输入图像块的数目，xg表示第g张去均值化图像块，g∈[1,m]，∈表示属于符号；第4步，按照下式，对去均值化图像块进行去相关处理；其中，y表示去相关处理后的图像块，U表示图像块左奇异向量组成的矩阵，S表示图像块的奇异值元素组成的对角矩阵，ε表示规则化参数，ε的取值范围为0.01～0.1，T表示转置操作，x表示去均值化图像块；(4)训练稀疏自编码网络：(4a)将白化后的图像块作为稀疏自编码网络的输入矩阵和目标矩阵；(4b)采用正态分布函数，随机初始化稀疏自编码网络的权值和偏置；所述的正态分布函数的均值为0，方差的随机取值范围为0.01～0.1；(4c)采用反向传导算法，更新稀疏自编码网络权值和偏置，得到稀疏自编码网络的权值；(5)获得卷积特征图；(5a)将训练样本和测试样本作为卷积的输入矩阵；(5b)按照稀疏自编码网络的权值排列顺序提取11×11大小的卷积核；(5c)采用卷积公式，对输入矩阵进行卷积，得到输入样本和测试样本的卷积特征图；(6)获得池化特征图；采用最大池化方法，对训练样本和测试样本的卷积特征图进行池化处理，得到训练样本和测试样本的池化特征图；(7)训练分类器；用训练样本的池化特征图训练线性支持向量机分类器得到分类模型；(8)测试分类效果；用分类模型对测试样本的池化特征图进行分类，得到测试样本的分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510523173.6/，转载请声明来源钻瓜专利网。

上一篇：具有颜色渐变效果的二维码、生成方法与生成系统
下一篇：监管宠物的方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的手语识别方法有效

专利文献下载