[发明专利]一种基于图像空间金字塔特征包的手势识别方法有效
申请号: | 201410301604.X | 申请日: | 2014-06-27 |
公开(公告)号: | CN104156690B | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 曹江涛;余思泉;李平 | 申请(专利权)人: | 辽宁石油化工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 沈阳科苑专利商标代理有限公司21002 | 代理人: | 许宗富 |
地址: | 113001 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 空间 金字塔 特征 手势 识别 方法 | ||
技术领域
本发明属于图像处理与模式识别领域,具体涉及一种基于图像特征提取与支持向量机的手势识别方法。
背景技术
现代人机交互方式正朝着一种更和谐、自然地方向发展。人机交互研究的一个热点问题是使得用户可以方便、自然地使用人类所熟知的方式使用计算机。手势语言具有简洁、直观的特点,是人机交互方式的一种有效扩展,在智能家电控制,机器人控制,手语识别,计算机游戏控制等方面有着广泛的应用。
手势识别的关键技术在于手势图像的特征提取与手势识别两个步骤。当前最常用的图像特征提取的方法有利用边缘特征像素点特征提取,利用傅里叶算子描述手势特征,利用手掌手指的空间分布特性表示手势,利用基于图像特征包算法的手势图像特征提取。
在手势特征提取阶段,现有技术的主要问题为:
(1)利用边缘特征像素点特征提取。不能对尺度、旋转、光照变化保持不变性,必须收集各种情况下的手势训练样本。详见:张国良,吴江琴,高文等.基于Hausdorff距离的手势识别[J].吉林图象图形学报,2002,7(7):1144-1150
(2)利用傅里叶算子描述手势特征和利用手掌手指的空间分布特性表示手势,这两种方法解决了特征对尺度、旋转、光照的适应性,但运算量大,运算时间消耗长。详见:葛元,郭兴伟,王林泉.傅立叶描述子在手势识别中的应用[J].计算机应用与软件,2005,6(22):91-93
张汗灵,李红英,周敏.融合多特征和压缩感知的手势识别[J].湖南大学学报(自然科学版),2013,3(40):87-92
(3)利用基于图像特征包(Bag of Features,BoF)算法的提取手势图像特征。该算法较为有效。缺点是该算法只描述了手势图像的特征点的数量信息,而忽略了特征点的空间分布特性。不能很好的识别相似的手势。详见:陈小波,谢秋生.基于Bag of Features的手势识别[J].计算机工程与设计,2013,3(34):983-988
当前最常用的手势识别的方法有:
(1)基于模板匹配的方法。(2)基于Adaboost的方法。通过一系列弱分类器构成一个强分类器,实现手势识别。(3)基于支持向量机的方法。手势识别通常为线性不可分的样本,支持向量机解决线性不可分样本的方法是通过核函数,将线性不可分样本通过核函数映射到线性可分的空间上,实现样本分类。
存在的主要技术问题为:
(1)模板匹配需要大量训练图像,计算速度慢。(2)Adaboost分类器设计复杂,计算量大,计算速度慢。详见:丁友东,庞海波,吴学纯等.一种用于手势识别的局部均值模式纹理描述子[J].应用科学学报,2013,(5):526-532。(3)支持向量机能够很好的解决线性不可分,小样本的分类问题。但选用的核函数及核函数的参数对识别结果影响较大。
发明内容
为了克服上述现有技术存在的不足,本发明设计了一种基于图像特征提取与支持向量机的手势识别方法。
本发明解决其技术问题所采用的技术方案是:一种基于图像空间金字塔特征包的手势识别方法,包括以下步骤:
对带有手势的图像进行手势分割;
对分割出来的手势图像进行特征提取和描述;
利用提取的特征训练直方图相交核支持向量机,并根据支持向量机得到该手势图像的特征向量所属的手势类别,实现手势识别。
所述对分割出来的手势图像进行特征提取和描述包括以下步骤:
(2.1)将手势图像构造成三层手势图像,第一层将整张手势图像划分为16个子块,第二层将整张手势图像划分为4个子块,第三层为整张手势图像;
(2.2)将第三层的整张手势图像均匀分成若干个像素为16×16的小块,对每个小块生成尺度不变特征变换描述子;
(2.3)将特征变换描述子用聚类的方法生成多个聚类中心,以聚类中心为视觉词汇,所有的聚类中心构成特征包;
(2.4)对每一层手势图像的每一块进行特征包量化,得到每层图像的特征向量;
(2.5)将三层的特征向量融合成一个新的向量,用于训练直方图相交核支持向量机。
所述将特征变换描述子用聚类的方法生成多个聚类中心包括以下步骤:
①从手势样本库的特征向量空间中,任取一个向量为第一个初始聚类中心其中,为每个特征点的SIFT特征描述向量,m为从手势样本库的所有手势图像中提取的特征点个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁石油化工大学,未经辽宁石油化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410301604.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序