[发明专利]图像识别方法和装置有效
申请号: | 201110361083.3 | 申请日: | 2011-11-15 |
公开(公告)号: | CN103106387A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 赵颜果;郑锋;宋展 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06T7/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
【技术领域】
本发明涉及图像分析领域,特别是涉及一种图像识别方法和装置。
【背景技术】
近年来,随着智能终端设备的普及,寻求一种更自然更简单的人机交互方式已然成为科研和产业领域的热点问题。纵观人机交互技术的发展历史,已逐渐从鼠标、键盘、遥控器等方式发展为视觉、语音、姿态等非接触式的操作方式,而且视觉技术作为其中最为重要的手段。即通过摄像头获取画面,基于图像智能分析技术判断操作者的动作和意图,进而控制机器。但其所面临最大的问题是环境的复杂性和不确定性,使得该技术还未完全成熟。随着3D技术的发展,微软推出了Kinect系统,其通过动态三维重建技术,将人机交互由2D的图像空间拓展到真实的3D空间,3D空间的深度信息有效的解决了2D空间中较为复杂的背景分割问题,使得该技术趋于成熟,并已应用到电视机、游戏机等设备中,用做外置的人机交互设备。
传统技术的不足是:
(1)基于辅助设备的手势人机交互方式:需要用户手持或者穿戴具有明显标记物的手柄或者手套,用于降低视觉检测和识别的难度,但却失去了手势操作本该具有的自然性和便利性;
(2)基于视觉的手势识别操作技术:受限于其算法的稳定性和抗干扰性,当场景较为复杂或者外界光照影响较为严重时,其手势目标检测准确性和跟踪及识别的准确率急剧下降,根源于其机器学习和模式识别算法的有效性和鲁棒性;
(3)基于3D技术的手势体感控制技术:以微软Kinect系统为代表的该技术通过动态三维重构技术实现了对场景的三维实时重建,将视觉检测算法由2D导入3D空间进行,降低了识别的难度,但增加了硬件成本和计算量,而且产品体积较大,很难嵌入到现有的智能终端设备中。
【发明内容】
基于传统技术的各种不足,有必要提供一种识别精度更高的图像识别方法和装置。
一种图像识别方法,包括如下步骤:
步骤S201,获取待检测图像;
步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像;
步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;
步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;
步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;
步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;
步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;
步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。
本发明一较佳实施例中,所述步骤S203中所述至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定所述窗口图像是所述目标图像后,所述步骤S203再进行更高分辨率的剖分;当在某一分辨率下所述步骤S207判定所述窗口图像不是所述目标图像,则所述步骤S203不进行更高分辨率的剖分,此时就最终判定所述窗口图像不是所述目标图像。
本发明一较佳实施例中,在提取所述细胞单元的梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。
本发明一较佳实施例中,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。
本发明一较佳实施例中,所述步骤S204中,高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。
一种图像识别装置,其包括图像获取单元和截图单元,所述图像获取单元用于获取待检测图像;所述截图单元用于通过预设窗口从所述待检测图像上截取得到窗口图像;所述图像识别装置还包括:
剖分单元,用于利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;
提取单元,用于提取各个分辨率下所述细胞单元的梯度方向直方图;
整合单元,用于分别将同一分辨率下的所有所述细胞单元的梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110361083.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抹泥板支架
- 下一篇:微齿隼铆框式基板两层实木复合地板
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序