[发明专利]基于光流法的手势运动方向识别方法有效

专利信息
申请号: 201410535947.2 申请日: 2014-10-11
公开(公告)号: CN104331151B 公开(公告)日: 2018-02-23
发明(设计)人: 杨盈昀;茹家馨;姜秀华 申请(专利权)人: 中国传媒大学
主分类号: G06F3/01 分类号: G06F3/01;G06K9/00;G06K9/60
代理公司: 北京思海天达知识产权代理有限公司11203 代理人: 沈波
地址: 100024 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 基于光流法的手势运动方向识别方法,通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理;肤色样本在CbCr平面上较为集中地分布在近似椭圆的区域中,通过像素点在CbCr平面上是否落在此椭圆域来确定是否肤色;对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算;对各个白色连通区域进行标记并求面积,然后按照面积从大到小排列,保留三个最大的连通区域;降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量;对光流运动矢量做方向判断;每隔两帧判断一次方向,两次一致才给出结果;在熟悉并掌握本发明的手势运动操作规律后,在摄像头前进行手势的上下左右四个方向的运动,本发明可以完成实时交互并且手势运动方向识别正确率可在95%以上。
搜索关键词: 基于 光流法 手势 运动 方向 识别 方法
【主权项】:
基于光流法的手势运动方向识别方法,其特征在于:该方法的实施流程如下:步骤1、通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理,包含GrayWorld彩色均衡处理与高斯平滑操作;先计算图像的R、G、B三分量各自的平均值avgR、avgG、avgB,获得图像的平均灰度值avgGray=(avgR+avgG+avgB)/3,然后对于图像中的每个像素,调整其R、G、B分量成为R=R·avgGray/avgR,G=G·avgGray/avgG,B=B·avgGray/avgB,最后将各像素的R、G、B值调整到可显示范围,若分量值大于255,调整为255;在GrayWorld处理后,对图像进行高斯平滑操作来消除摄像头采集过程中产生的随机噪声;步骤2、YCbCr域椭圆肤色检测;肤色样本在CbCr平面上较为集中地分布在近似椭圆的区域中,所以通过像素点在CbCr平面上是否落在此椭圆域来确定是否肤色;肤色椭圆区域由式(1)表示,其中cx=109.83,cy=152.02,θ=2.53,ecx=1.60,ecy=2.41,a=25.39,b=14.03,x与y的取值由式(2)所示;(x-ecx)2a2+(y-ecy)2b2=1---(1)]]>xy=cosθsinθ-sinθcosθCb-CxCr-Cy---(2)]]>在计算过程中,由图像像素点的Cb、Cr值算出x与y值,当x与y值落在式(1)所表示的椭圆区域,则令图像像素值为1,否则为0,这样得到肤色像素点为白色,非肤色像素点为黑色的二值图;步骤3、对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算;在数学形态学中,腐蚀是将边界的像素点缩小至目标物体内部的一个像素点子集,消除图像中目标物体的边界;膨胀是将图像中的目标物体的像素点扩大至周围的一个像素点子集,使周围的像素点的值与该像素点保持一致;单独对图像膨胀或者腐蚀都或多或少对图像造成损害,将膨胀和腐蚀结合在一起降低对图像造成的损害,闭运算是对图像进行先膨胀后腐蚀,填补图像中的空洞,连接细小的挨在一起的物体;对步骤2得到的二值图像进行闭运算得到人脸与人手是两个白色清晰连通区域的图像;步骤4、对各个白色连通区域进行标记并求面积,即计算各个白色连通区域含有多少个像素点,然后按照面积从大到小排列;如果画面中有较大的类肤色物体,与黄种人肤色几乎一致的棕黄色家具,也会形成一个较大的连通区域且其像素数量未知,所以需要保留像素数量排行前三位的连通区域,代表着人脸、人手与面积未知的干扰区域,其余所有连通区域全部作为无关信息进行剔除;步骤5、降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量;Lucas‑Kanade光流法的公式如式(3)所示:A=[▿I(x1),...,▿I(xn)]TW=ding[W(x1),...,W(xn)]b=-(It(x1),...,It(xt))Tv=[ATW2A]-1ATW2b---(3)]]>其中,W(x)表示窗口权重函数,它使邻域中心部分对光流约束产生的影响比外围部分更大,v=(u,v)T是要求解的光流运动信息,I(x,y,t)是图像点(x,y)在时刻t的照度,u和v是该点光流的水平和垂直分量,代表着运动信息,▽I(x)=(Ix,Iy)T;金字塔Lucas‑Kanade光流法采用常用的LK光流法算法加入高斯金字塔迭代方法,即构造图像序列的一个金字塔,高层是低层图像的下采样形式,图像分解到一定层数时,相邻帧之间的运动量就会变得足够小,满足LK光流法的局部约束条件;在金字塔的最高层计算光流,然后将得到的运动估计结果作为下一层金字塔的起始点,重复迭代这个过程一直到金字塔的底层,即具有原始分辨率的图像,这样实现对更快更长的运动跟踪;步骤6、对光流运动矢量做方向判断;光流运动矢量分为水平运动分量u和垂直运动分量v;对相邻两帧图像做光流法操作获得的各像素的u与v值做这样的判定:式(4)~(7)分别表示像素点向右、左、上、下运动;当运动方向一致的像素数量超过一定的阈值,则可以判定手部的运动方向;u>10&‑10<v<10  (4)u<‑10&‑10<v<10  (5)v>10&‑10<u<1  (6)v<‑10&‑10<u<10  (7)将运动方向一致的像素数的阈值设定为图像像素总数的二十分之一,在QVGA分辨率下这个阈值为3840,运动方向判定为向左的像素数超过了3840,而其他方向的像素数远少于3840,则判定手部运动方向为左移;步骤7、每隔两帧判断一次方向,两次一致才给出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410535947.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top