[发明专利]识别图像中的对象的方法、设备和计算机可读存储介质在审
申请号: | 202010285817.3 | 申请日: | 2020-04-13 |
公开(公告)号: | CN113536826A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 庞占中;汪留安;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06T3/40;G06T7/60 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;杜诚 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 中的 对象 方法 设备 计算机 可读 存储 介质 | ||
本申请公开了一种用于识别图像中的对象的方法和设备以及计算机可读存储介质。该方法,包括:将图像的不同缩放比例版本分别输入一个或更多个检测模型,以检测所述图像中的对象;基于要识别的对象的特征,对所述一个或更多个检测模型的检测结果进行过滤;和融合所述一个或更多个检测模型的过滤后的检测结果。
技术领域
本公开内容涉及物体检测,并且具体地涉及图像中的大尺度变化范围的物体的检测。
背景技术
物体检测场景中经常出现待检测物体的尺度变化范围较大,这增加了检测难度。例如,在遥感图像中,物体的角度是任意的、其外观和尺度变化很大并且背景也很复杂。比如,在公开数据集DOTA1.0中,物体的尺度范围从20×20像素到1200×1200像素,如图1所示
目前最流行的方法都是基于两阶段目标检测方法,例如Faster RCNN(甚高速区域卷积神经网络)、FPN(特征金字塔网络)、SPPNet(空间金字塔池化)等。这些方法均取得了令人满意的效果。
然而,对于物体检测任务来说,特别是具有大尺度变化范围的检测任务,例如准确定位和分类遥感图像中的目标,如车辆、飞机、桥梁等,一个单一的模型实际上是不够鲁棒和泛化的,而且通常对小尺寸和大尺寸物体的检测效果并不理想。
发明内容
在下文中给出了关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,这个概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本发明的一个方面,提供了一种用于识别图像中的对象的方法,包括:将图像的不同缩放比例版本分别输入一个或更多个检测模型,以检测所述图像中的对象;基于要识别的对象的特征,对所述一个或更多个检测模型的检测结果进行过滤;和融合所述一个或更多个检测模型的过滤后的检测结果。
根据本发明的另一个方面,提供了一种用于识别图像中的对象的设备,包括:检测装置,其被配置成将图像的不同缩放比例版本分别输入一个或更多个检测模型,以检测所述图像中的对象;过滤装置,其被配置成基于要识别的对象的特征,对所述一个或更多个检测模型的检测结果进行过滤;和融合装置,其被配置成融合所述一个或更多个检测模型的过滤后的检测结果。
根据本发明的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。
通过本发明的用于识别图像中的对象的方法和设备,使得提高对图像中的大尺度变化范围的物体的检测精度。
通过以下结合附图对本发明的优选实施方式的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
为了进一步阐述本公开内容的以上和其它优点和特征,下面结合附图对本公开内容的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本公开内容的典型示例,而不应看作是对本公开内容的范围的限定。在附图中:
图1示意性地示出了DOTA数据集中的物体尺寸的沿横轴归一化的分布;
图2A示出了检测模型R2CNN++的架构;
图2B示意性地示出了R2CNN++对应的多个特征层及其融合;
图3是根据一个实施方式的用于识别图像中的对象的方法300的流程图;
图4示意性地示出了图3的方法300的优选实施方式;
图5A和5B示出了通过根据本发明的实施方式的用于识别图像中的对象的方法所获得的检测效果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010285817.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件结构的制备方法
- 下一篇:一种自密实高延性混凝土及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序