[发明专利]一种基于RGB‑D图像的人体识别方法在审

专利信息
申请号: 201610405934.2 申请日: 2016-06-09
公开(公告)号: CN107491712A 公开(公告)日: 2017-12-19
发明(设计)人: 廖鸿宇;陶学宇;孙放 申请(专利权)人: 北京雷动云合智能技术有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 rgb 图像 人体 识别 方法
【说明书】:

技术领域

发明属于计算机视觉和模式识别领域,尤其涉及一种基于RGB-D图像的人体识别方法。

背景技术

对于许多机器人、交互系统以及智能交通,人体识别是一个重要并且基础的部分。在这个项目中,摄像头和测距仪是目前比较通用的传感器。每个传感器的感知通道既有优点也有缺点,因此它们间的区别主要取决于所提供的图像和范围数据的可靠性。

许多机器人学方面的研究者对范围数据中识别人体的方法进行了研究。早期工作主要采用2D范围数据来完成这个任务,在3D范围数据中的人体识别及其相关工作又成为一个新的问题。

在计算机视觉中,从单个图片识别人体这个问题已经被研究过很长一段时间了。近期的工作主要采用基于部分的投票或者窗口卷动。在前者方法中,人体部分独立为一个人的出现进行投票;后者的窗口卷动方法中,通过在不同图像的尺度空间位置卷动一个固定长度的检测窗口,对窗口下的区域进行分类。其它工作主要是解决多模式的人体识别问题:提出一个可训练的2D范围数据和摄像头系统,采用立体音响系统并结合强图像和低分辨率摄像机来采集不同地图和光流的图像数据。上述检测方法在行人流动十分密集的情况下的检测性能会有所下降,从而导致表现的性能不佳。

发明内容

本发明的目的在于针对上述技术中存在的缺陷,提出了一种基于RGB-D图像的人体识别方法。首先,构建一个面向深度的直方图(HOD),HOD对深度变化方向进行局部的编码并且依赖于一个深度信息的规模空间搜索,此搜索方法将将检测过程速度提高到原来的3倍;接着,将视觉HOG与深度HOD相结合提出了Combo-HOD,这个检测方法依赖于深度图和RGB数据并将它们作为传感器输入数据。

为了实现上述目的,本发明提供的技术方案如下:一种基于RGB-D图像的人体识别方法,主要包括如下步骤:

步骤1、构建面向深度的直方图(HOD)

步骤1.1、运算法则:首先将固定长度的窗口划分成网格并计算每个网格对应的深度梯度值;接着将这些面向深度的梯度值累积到1D的直方图中;然后将每四个网格相结合形成一个描述信息块;最后将这些描述信息块收集在一起并将直方图标准化成L2-Hys单元长度,使得其在局部深度噪声下表现高水平的稳健性,HOD特征的结果被用于训练柔和的线性支持向量机(SVM)。

步骤1.2、深度图像处理:由于原始的深度图像主要由一些对真实的标准深度非常不均匀地编码的值组成,对于很远的物体,一个深度值的差异能够与一个15厘米的跳跃范围相对应,因此,采用公式d=8BFx/(Vmax-v)对原始范围深度图像数据进行处理来加强前景和后景的区分度;然后,将上述公式得到结果的d值乘上M/Dmax,其中M=100是一个常量,Dmax=20是一个以米为单位的最大考虑范围。这个处理步骤旨在提升图像强度的反差,在此,可以充分利用微软Kinect RGB-D传感器的优点来取消物理声音模型的非线性。

步骤1.3、深度信息的规模空间搜索:采用深度信息作为搜索过程的指导,创建一个快速在深度图的每个位置区分可兼容的范围的方法;

步骤1.3.1、计算基于深度范围的回归值s:从训练数集中计算得到平均人体身高Hm,地面位置和每个样本的高度能够被准确地注释,公式如下所示:

其中,Fy是IR摄像头的垂直焦距长度,Hm=1.74米是所监测到人体平均身高,Hw是计算基于深度范围的回归值s中以米为单位的窗口的高度。上述公式的左边部分代表了图像在半平面的投影高度Hm,这与摄像头所处的距离d相垂直。为了限制内存的使用,上述等式每个部分被量化到1/3的规模。

然后,计算深度图的每个像素点的范围s来生成一个范围地图,从这个范围地图中,推导出所有使用的范围S的列表,列表只包括图像中与人体表现相兼容的范围,这个方法避免了在一些不均匀搜索(例如图像金字塔)解决方案中对许多范围的考虑。

对于给定的范围列表S,S由每个图像计算得到,开始深度信息的规模空间搜索时,只有当搜索窗口的深度信息与S中的值相对应才能被送到SVM分类器进行下一步。在列表S选择一个范围s并检测该窗口下的深度值是否与每个规模空间的位置相符合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷动云合智能技术有限公司,未经北京雷动云合智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610405934.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top