[发明专利]手势检测方法及系统有效
申请号: | 201210290338.6 | 申请日: | 2012-08-15 |
公开(公告)号: | CN102831404A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 宋展;赵颜果;聂磊;杨卫;郑锋 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F3/01 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势 检测 方法 系统 | ||
技术领域
本发明涉及基于视觉和图像的目标检测和识别及人机交互领域,尤其涉及一种适用于电视嵌入平台的手势检测方法及系统。
背景技术
基于手势识别的体感控制技术,已经成为目前一种重要的人机交互手段。其通过普通摄像头采集用户的动作画面,通过模式识别算法,对图像中的手部特征进行检测和定位,并识别出手部的形状,将这种识别信息转化为操作信号,反馈给智能电视等终端,并触发相应的操作命令,如电视节目的切换,音量的调节,简单的游戏互动等。手势识别技术基于智能终端所配备的摄像头,在终端安装相应的识别软件,即可完成以上操作,因而在硬件成本和操作方式上都具有极大的优势,因而该技术正在逐渐成为智能电视的标配模块。
根据手势识别的研究和应用的发展过程,大致可以划分为以下几种技术手段:
(1)基于数据手套或佩戴物:通过用户佩戴特制的手套或者标识物,通过摄像头来进行识别,手套本身是特殊设计的,具有明显的特征,因而可以降低检测和识别算法的复杂性,但是这种佩戴式的操作方式,显然难以满足自然的人机交互的需要,因而该方法始终未得到广泛的应用;
(2)基于3D深度相机:代表技术为微软的KINECT产品,其通过三维扫描设备,获取操作者的动态三维模型,因为其工作在3D空间,因而避免了2D空间中存在的颜色干扰、图像分割等大量的难题。但是3D扫描设备体积较大,硬件成本较高,所需的运算能力更高,因而难以集成并应用到大众化的智能终端如电视、手机等设备上;
(3)基于普通摄像头2D图像识别的技术:由于这种技术是基于普通摄像头来实现的,因而也是最具有大规模应用潜力的技术,但是该技术的缺点也非常明显:a)对于单纯基于肤色特征的手势检测技术而言,环境的光照很容易改变手部的颜色特征,使得检测变得困难;b)对于基于形状特征的手势检测而言,复杂背景中存在的类似目标物体很容易造成误检;c)对于融合多种特征的手势检测算法而言,虽然其在检测精度方面有所提升,但还是不能从根本上解决光照及背景的影响问题,更重要的,随着算法复杂度的提升,其运算量急剧增加,显然难以满足现有的智能电视等终端的需要。
综上,目前的手势识别算法由于其本身的复杂性以及所需的大量的视频处理,在现有的智能终端如智能电视的嵌入式平台上很难得到流畅的运行。
因而如何开发简单快速而稳定的手势识别算法,使其可以在低运算能力的嵌入式平台上得以应用已成为目前急需解决的问题,而对于所有的手势交互系统而言,手势的检测是至关重要的第一步。
发明内容
为了克服上述技术问题,本发明提供一种适用于电视嵌入平台的手势检测方法及系统,所述手势检测方法,包括如下步骤:检测一种预定义的运动方式,用于确定检测感兴趣区域;在所述感兴趣区域内对预定义手势进行多尺度滑动窗口检测;从每个窗口图像的肤色隶属度图像中提取局部均值特征;用Ada-Boost分类器对所述局部均值特征来做手势-背景的分类,若被分类为手势,则相应窗口作为候选目标窗口;对所述候选目标窗口,基于窗口图像的灰度图像提取点对特征;使用随机森林分类器对所述点对特征做分类,得到相应于各类手势的目标窗口;对所述各类手势的目标窗口进行聚类处理;输出成功检测到的手势类别及其所在的准确位置。
优选地,所述预定运动方式为往返性挥手运动。
优选地,所述挥手动作的检测是通过肤色隶属度图像的绝对差分图像的积分图来来实现的。
优选地,其特征在于,通过字典法来实现所述肤色隶属度图像的快速计算。
优选地,通过更新率来计算肤色运动积分图像,其步骤包括:对当前帧视频,先使用字典法计算肤色隶属度图;与上一帧的肤色隶属度图像做差分,得到绝对差分图;所述差分图结合上一帧状态的积分图像,使用更新率,计算当前帧状态的肤色运动积分图像。
优选地,所述多尺度滑动窗口检测的步骤,包括:基于所述字典法计算感兴趣区域的肤色隶属度图像;基于肤色的进行窗口滤波;基于点对特征和随机森林分类器进行决策阶段。
优选地,所述窗口滤波的执行步骤,包括:基于窗口图像的肤色隶属度图像提取局部均值特征;
使用预先训练的AdaBoost分类器对局部均值特征做分类,从而实现基于肤色的窗口过滤,最后形成一系列候选目标窗口。
优选地,所述对各类手势的目标窗口进行聚类的步骤,还包括:对聚类后形成的窗口簇进行置信度分析;置信度小于阈值者被过滤;置信度大于等于阈值的窗口簇的代表窗口用于确定所述手势的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210290338.6/2.html,转载请声明来源钻瓜专利网。