[发明专利]一种应用于复杂背景场景的快速运动手势识别方法有效
申请号: | 201710894579.4 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107798296B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 杨滨 | 申请(专利权)人: | 江南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 邵骅 |
地址: | 214081 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种应用于复杂背景场景的快速运动手势识别方法,包括采集手势动作视频,通过去除YCrCb模式下的图像的亮度干扰,并转换为灰度模式图像进行手势分割,并输入到深度置信网络中进行训练;和手机采集手势视频,获得手势轮廓图像通过深度置信网络实现手势识别的手势判断的步骤。因此,本发明运算速度较快,易于在复杂背景下识别快速运动的物体。深度置信网络作为一种深度学习模型,在特征选择与特征学习方面有着显著的优势,并能够进行分类特征学习,充分挖掘灰度求和图像的特征信息。 | ||
搜索关键词: | 一种 应用于 复杂 背景 场景 快速 运动 手势 识别 方法 | ||
【主权项】:
一种应用于复杂背景场景的快速运动手势识别方法,其特征在于包括下述步骤:(1)训练神经网络:1.1从视频库中获取一段手势动作帧序列,假设总帧数为n;1.2获取第i帧图像Ii转换为YCrCb色彩模型,对原图像每个像素点,执行以下公式运算,得到每个像素点的Y、Cr、Cb通道值:YCrCb=0128128+0.2990.5870.114-0.1687-0.33130.50.5-0.4187-0.0813RGB]]>其中R、G、B分别表示像素点的红绿蓝通道值;1.3在YCrCb模式下的图像Ii去掉Y通道内容,以Cr通道信息为主,Cb通道信息为辅,把Cr,Cb通道合并为一个通道图像Iig,公式如下值:Iig=α*Cr+(1‑α)*Cb其中α=0.92;1.4通过以下公式计算出图像Iig的均值μig和方差σig:1.5参照一维正态分布的概率密度分布表,得到在[μ‑2.96,μ+2.9δ]范围内的概率非常接近1,将像素值处于该范围内的像素点看作肤色点,执行以下公式把图像变成灰度图像Iib:Iib(x,y)=INT(256*i/n),Iig∈[μ-2.9δ,μ+2.9δ]0,else;]]>1.6如果第i帧是最后一帧,则执行步骤1.7,否则,则i=i+1,跳转到步骤1.2;1.7对所有灰度图像Iib执行通道求和操作,得到求和图像Ib;1.8把图像Ib输入到深度置信网络中进行训练,输入下个视频,跳转到步骤1.1;1.9对训练库里的所有视频执行步骤1.1‑1.7后,得到训练好的神经网络;(2)手势判断:2.1通过摄像头拍摄获取到一段手势动作帧序列,假设总帧数为n;2.2执行训练神经网络步骤中的1.2‑1.7步骤,得到图像S;2.3把图像S输入到训练好的深度置信网络中,判断出输入的手势动作属性什么类型手势;2.4输出结果,进行相应手势操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710894579.4/,转载请声明来源钻瓜专利网。
- 上一篇:行车提醒方法、装置及设备
- 下一篇:一种基于帧间差分自动提取稳定帧的方法