[发明专利]物体的检测方法及装置、电子设备和存储介质在审
申请号: | 202010858259.5 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112101134A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 孙明珊;暴天鹏;吴立威 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;董文俊 |
地址: | 518054 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 检测 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种物体的检测方法和相关产品,该方法包括:基基于目标图像,得到第一子图像集;所述第一子图像集中的多个子图像均包含于所述目标图像且所述多个子图像中任一子图像的尺寸小于所述目标图像的尺寸;对所述第一子图像集中的各子图像进行目标检测,得到多个子图像检测结果;基于所述多个子图像检测结果,得到目标检测结果;所述目标检测结果包含所述目标物体在所述目标图像中的边界框的坐标和所述目标物体的类别信息。本申请实施例中,先对多个尺寸较小的子图像进行目标检测以得到多个子图像检测结果,再基于该多个子图像检测结果,得到目标检测结果;能够准确地定位出目标图像中尺寸较小的物体。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种物体的检测方法及装置、电子设备和存储介质。
背景技术
计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。
作为计算机视觉中最基本和最具有挑战性的问题之一,目标检测近年来受到了极大的关注。目标检测是一项基本的计算机视觉任务,它提供了用于图像和视频理解语义分割的基本信息,也能够用于检测图像中特定类别视觉对象的实例。目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。
随着计算机技术的发展和计算机视觉原理的广泛应用,如何准确地利用计算机图像处理技术对图像中的目标(例如极小物体)进行定位是急需解决的问题。
发明内容
本申请实施例公开了一种物体的检测方法和相关产品。
第一方面,本申请实施例提供了一种物体的检测方法,该方法包括:基于目标图像,得到第一子图像集;所述第一子图像集中的多个子图像均包含于所述目标图像且所述多个子图像中任一子图像的尺寸小于所述目标图像的尺寸;对所述第一子图像集中的各子图像进行目标检测,得到多个子图像检测结果;所述多个子图像检测结果与所述多个子图像一一对应,所述多个子图像检测结果包含针对所述多个子图像中任一子图像进行目标检测得到的第一子图像检测结果,所述任一子图像中包括目标物体,所述第一子图像检测结果包括用于确定所述目标物体在所述目标图像中的边界框的信息和所述目标物体的类别信息;基于所述多个子图像检测结果,得到目标检测结果;所述目标检测结果包含所述目标物体在所述目标图像中的边界框的坐标和所述目标物体的类别信息。
本申请实施例提供的物体的检测方法适用于定位图像中较小物体的场景,尤其适用于定位图像中极小物体的场景,例如通过对图像进行目标检测得到图像中各极小物体的边界框和类别信息的场景。图像中的极小物体可以是在图像对应的像素点的个数不超过参考阈值的物体,参考阈值可以是20、50、100、200等;也可以是在图像中占用的区域相比于整个图像的比例小于比例阈值的物体,该比例阈值可以是0.001、0.01等;还可以是物体检测装置对目标图像进行目标检测可识别出的物体,物体检测装置为本申请实施例的执行主体。举例来说,目标图像为高铁触网巡检车车顶上的高清成像设备采集得到接触网图片,采用本申请实施例提供的方法可定位接触网图片中的极小零部件,例如螺母、螺栓、开口销等。又举例来说,本申请实施例提供的方法可应用于生产流水线上各种零部件的故障定位。本申请实施例提供的定位方法的主要原理是:将目标图像切分为多个子图像;分别对每个子图像进行目标检测,得到多个子图像检测结果;根据多个子图像检测结果,得到目标检测结果。应理解,由于目标图像中极小物体(例如目标物体)占用的区域很小,即占用的像素点个数很少,对该目标图像进行目标检测不能准确地定位中极小物体的边界框。本申请实施例中,将目标图像切分为多个子图像,对每个子图像进行目标检测可以更准确地定位出极小物体的边界框以及更准确地对极小物体进行分类。
本申请实施例中,先对多个尺寸较小的子图像进行目标检测以得到多个子图像检测结果,再基于该多个子图像检测结果,得到目标检测结果;能够准确地定位出目标图像中尺寸较小的物体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010858259.5/2.html,转载请声明来源钻瓜专利网。