[发明专利]基于卷积神经网络的数字手势识别方法在审
申请号: | 201910147442.1 | 申请日: | 2019-02-27 |
公开(公告)号: | CN110046544A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 张国山;赵阳 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 手势识别 手势图像 样本集 滤波 手势 形态学 预处理 提取图像特征 图像 测试数据集 训练样本集 分类标记 滤波处理 深度相机 图像建立 图像信息 测试集 训练集 分类 构建 采集 | ||
1.一种基于卷积神经网络的数字手势识别方法,包括下列步骤:
(1)利用Kinect深度相机采集10类数字的手势图像,对手势图像进行滤波处理;利用滤波后的图像建立各数字手势表征的样本集,方法如下:对滤波后的手势图像进行形态学预处理;分类标记图像信息,获得各数字手势表征的样本集,并分类制成训练集和测试集;
(2)构建卷积神经网络—CNN:
(2a)将各个类别的数字手势图像导入卷积神经网络,作为inputs层,其大小为[320,320,3,59];
(2b)构建8层卷积神经网络,对输入图像的每个像素进行卷积、下采样、池化等操作,得到每层的maps特征图;
(2c)将每层的输出作为下一层的输入,经过前后8个层,最后汇聚于全连接fc层,通过输出层softmax分类器输出结果;
(3)输入训练样本集,提取图像特征,进行分类训练;
(3a)采用softmax分类器,对图像特征向量进行分类;
(3b)采用卷积神经网络算法,对训练样本集进行训练,得到训练后的模型.mat文件;
(4)利用训练后的卷积神经网络识别测试数据集里的图像。
2.根据权利要求1所述的方法,其特征在于,步骤(1)的滤波方法如下:基于联合双边滤波器的深度图像滤波算法,将Kinect镜头同一时刻采集的手势图像的深度图像和彩色图像作为输入,用高斯核函数计算出深度图像的空间距离权值和RGB彩色图像的灰度权值,将这两个权值相乘得到联合滤波权值,设计联合双边滤波器,用此滤波器的滤波结果与噪声图像进行卷积运算实现Kinect深度图像滤波。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910147442.1/1.html,转载请声明来源钻瓜专利网。