[发明专利]目标检测方法及装置在审
申请号: | 201710550186.1 | 申请日: | 2017-07-07 |
公开(公告)号: | CN107292306A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙)11406 | 代理人: | 孙德崇 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 | ||
技术领域
本公开涉及计算机视觉技术领域,尤其涉及目标检测方法及装置。
背景技术
随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术进行目标检测的研究越来越热门。目标检测技术可以应用于智能化交通系统、智能监控系统、军事目标检测及医学导航手术等方面。目标检测技术在图片搜索引擎中也发挥着重要作用。
相关技术中的目标检测技术无法较好地检测小尺寸的目标。当目标的大小在图像中的占比小于1/20时,检测得到的目标的边界框的位置和大小会急剧增大。当目标的大小在图像中的占比小于1/40时,基本上无法检测到目标。
发明内容
为克服相关技术中存在的问题,本公开提供一种目标检测方法及装置。
根据本公开实施例的第一方面,提供一种目标检测方法,包括:
确定图像中的感兴趣区域;
在所述图像中确定所述感兴趣区域的相关区域;
根据所述感兴趣区域和所述相关区域进行目标检测,所述目标在所述感兴趣区域中。
在一种可能的实现方式中,在所述图像中确定所述感兴趣区域的相关区域,包括:
确定所述感兴趣区域的几何中心;
在所述图像中,以所述几何中心为新几何中心,获取面积为所述感兴趣区域面积n倍的新区域,并确定所述新区域为所述相关区域,其中,所述n大于1。
在一种可能的实现方式中,在所述图像中确定所述感兴趣区域的相关区域,还包括:
以所述几何中心为新几何中心,获取m个新区域,每个所述新区域的面积为所述感兴趣区域面积的i倍,且每个所述新区域的面积不同;
确定所述m个新区域为所述相关区域;
其中,所述m为大于1的整数,所述i为m个不同的n。
在一种可能的实现方式中,根据所述感兴趣区域和所述相关区域进行目标检测,包括:
将所述感兴趣区域和所述相关区域分别映射到特征图上;
对各个特征图进行池化操作,得到池化后的各个特征图;
根据池化后的各个特征图进行分类处理和边界框回归处理,得到目标对应的边界框。
根据本公开实施例的第二方面,提供一种目标检测装置,包括:
第一确定模块,用于确定图像中的感兴趣区域;
第二确定模块,用于在所述图像中确定所述感兴趣区域的相关区域;
目标检测模块,用于根据所述感兴趣区域和所述相关区域进行目标检测,所述目标在所述感兴趣区域中。
在一种可能的实现方式中,所述第二确定模块包括:
第一确定子模块,用于确定所述感兴趣区域的几何中心;
第二确定子模块,用于在所述图像中,以所述几何中心为新几何中心,获取面积为所述感兴趣区域面积n倍的新区域,并确定所述新区域为所述相关区域,其中,所述n大于1。
在一种可能的实现方式中,所述第二确定模块还包括:
获取子模块,用于以所述几何中心为新几何中心,获取m个新区域,每个所述新区域的面积为所述感兴趣区域面积的i倍,且每个所述新区域的面积不同;
第三确定子模块,用于确定所述m个新区域为所述相关区域;
其中,所述m为大于1的整数,所述i为m个不同的n。
在一种可能的实现方式中,所述目标检测模块包括:
映射子模块,用于将所述感兴趣区域和所述相关区域分别映射到特征图上;
池化子模块,用于对各个特征图进行池化操作,得到池化后的各个特征图;
边界框确定子模块,用于根据池化后的各个特征图进行分类处理和边界框回归处理,得到目标对应的边界框。
根据本公开实施例的第三方面,提供一种目标检测装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法的步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:通过确定图像中的感兴趣区域,在该图像中确定感兴趣区域的相关区域,根据感兴趣区域和相关区域进行目标检测,由此能够结合感兴趣区域及其相关区域的特征进行目标检测,从而能够大大提高小尺寸目标的检测成功率和检测准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710550186.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人脸识别设备及方法
- 下一篇:一种倒置汉字验证码自动识别方法及系统