[发明专利]一种结合窗口评分与超像素组合的物体位置预估方法有效
申请号: | 201510888926.3 | 申请日: | 2015-12-04 |
公开(公告)号: | CN106846400B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 任桐炜;贝佳;刘璟 | 申请(专利权)人: | 南京大学 |
主分类号: | G06T7/70 | 分类号: | G06T7/70 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 窗口 评分 像素 组合 物体 位置 预估 方法 | ||
一种结合窗口评分与超像素组合的物体位置预估方法,在RGB‑D图像上先使用窗口评分初始化物体边界框,再在超像素表示的基础上确定物体边界框调整的弹性范围,最后综合利用颜色特征与深度特征,采用超像素组合方法对物体边界框进行调整,最终获得物体位置预估结果。本发明综合了两种主流的物体位置预估方法,综合利用了RGB‑D图像的颜色通道与深度通道,能够面对RGB‑D中物体位置预估的任务,取得比现有方法更好的物体位置预估效果。
技术领域
本发明属于计算机视觉技术领域,涉及到针对RGB-D图像的物体位置预估方法,具体为一种结合窗口评分与超像素组合的物体位置预估方法。
背景技术
在计算机视觉领域,物体位置预估是一项非常重要的研究内容,利用物体位置预估技术,计算机能够自动识别图像中的物体。这项技术作为基本技术广泛应用于场景分析,目标识别与匹配,视觉跟踪等领域。
RGB-D图像包含了颜色和深度两个通道。颜色通道与普通RGB图像相同,每个像素由R、G、B三个值来表示该像素的颜色信息;深度通道在每个像素上用一个值来表示物体与传感器之间的距离。
现有的物体位置预估的方法可以分为两个类别:窗口评分与超像素组合。窗口评分方法根据不同的能够衡量框内包含一个物体的可能性的特征对候选边界框进行评分。超像素组合将图片分解成不同的区域,然后合并相似的区域产生最后的结果。所述两种方法或它们的合并方法通常只考虑RGB-D图像的颜色通道,且仍有改进的空间,本发明所涉及的方法为窗口评分与超像素组合的合并,并且综合考虑了颜色通道与深度通道。
窗口评分与超像素组合方法各有其缺点,主要表现为无法同时满足效率与准确性。合并这两种方法以规避缺陷是一个新的想法,其相关方法依然处于不成熟的阶段,且目前出现的方法往往只考虑到了RGB-D图像的颜色通道而没有对深度信息进行利用,因此有必要给出针对RGB-D图像的方法。
发明内容
本发明要解决的问题是:针对RGB图像的位置预估方法通常只使用窗口评分方法粗略的获得窗口初始化结果,准确性不足,而超像素组合方法虽然提升了准确度,但往往需要很多的时间消耗,效率较低。虽然综合这两种方法的策略目前已经出现,但往往只考虑了颜色通道,而没有充分利用RGB-D图像的信息,且相关研究仍然处于不成熟的阶段。
本发明的技术方案为:一种结合窗口评分与超像素组合的物体位置预估方法,在RGB-D图像上先使用现有窗口评分方法获得初始的物体边界框,接着采用超像素表示图像,在超像素表示的基础上确定物体边界框调整的弹性范围,再采用超像素组合方法对边界框进行调整,最终获得物体位置预估结果。
本发明包括以下步骤:
1)利用窗口评分方法获取图像中的初始物体边界框;
2)采用超像素表示图像,确定初始物体边界框调整的弹性范围:
2.1)对于RGB-D图像,根据其颜色通道的信息将其表示为一组超像素S={s1,s2,…,sn};
2.2)对于初始物体边界框bk,定义为完全被bk所包含的一组超像素,为完全不被bk所包含的一组超像素,为剩余的与bk相交的一组超像素,作为物体边界框调整的弹性范围;
3)采用超像素组合方法对初始物体边界框进行调整:
3.1)将中的每个超像素si距中的任一超像素的最短中心距离作为其权重ω(si),然后根据ω(si)由小到大来选择超像素构成将作为调整时的参照,中的超像素数量满足如下的公式:
λ是一个范围参数,取λ=1.5;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510888926.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:隔氧除尘的秸秆炭化装置
- 下一篇:一种汽油脱砷剂的制备及应用