[发明专利]目标检测方法及装置、存储介质及电子设备在审
申请号: | 202011461779.9 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112613541A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 汪天才;张祥雨 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/02 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何少岩 |
地址: | 100090 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 存储 介质 电子设备 | ||
本申请涉及目标检测技术领域,提供一种目标检测方法及装置、存储介质及电子设备。其中,目标检测方法用于利用检测模型检测输入图像中的目标,该模型包括主干网络,隐式特征金字塔网络以及检测头部网络,隐式特征金字塔网络包括特征变换模块和特征求解器,该方法包括:利用主干网络提取输入图像的多尺度基础特征;利用特征求解器迭代求解特征变换模块所表征的隐函数的、关于多尺度均衡特征的不动点方程,作为隐式特征金字塔网络的输出的稳态多尺度均衡特征,该特征变换模块能够对其输入特征进行跨尺度融合,其输入包括多尺度基础特征以及多尺度均衡特征;利用检测头部网络根据稳态多尺度均衡特征进行目标检测。该方法有利于提高目标检测精度。
技术领域
本发明涉及目标检测技术领域,具体而言,涉及一种目标检测方法及装置、存储介质及电子设备。
背景技术
深度学习中的目标检测任务,一般是指利用神经网络模型对图像中的各个目标进行分类和定位的任务。主流的目标检测框架主要包含三部分:主干网络(backbone)、颈部网络(neck)和检测头部网络(detection head)。其中,颈部网络目前一般会部署某种特征金字塔网络(Feature Pyramid Network,简称FPN),在特征金字塔网络中,通过堆叠若干个跨尺度连接模块,来融合多个尺度的特征并扩大特征的感受野,进而改善目标检测效果,为了获得更大的感受野,则必须堆叠更多的跨尺度连接模块。但出于多方面因素(例如,模型参数数量、显存占用等)的考虑,现有的特征金字塔网络中一般也至多堆叠少量几个跨尺度连接模块,故增大感受野的效果有限,并不能明显提高目标检测精度。
发明内容
本申请实施例的目的在于提供一种目标检测方法、图像融合方法及对应装置,以改善上述技术问题。
为实现上述目的,本申请提供如下技术方案:
第一方面,本申请实施例提供一种目标检测方法,用于利用检测模型检测输入图像中的目标,所述检测模型为神经网络模型,该模型包括主干网络,隐式特征金字塔网络以及检测头部网络,所述隐式特征金字塔网络包括特征变换模块和特征求解器,所述方法包括:利用所述主干网络提取所述输入图像的多尺度基础特征;利用所述特征求解器迭代求解所述特征变换模块所表征的隐函数的、关于多尺度均衡特征的不动点方程,获得作为所述隐式特征金字塔网络的输出的稳态多尺度均衡特征;其中,所述特征变换模块的输入包括所述多尺度基础特征以及所述多尺度均衡特征,所述特征变换模块为能够对其输入特征进行跨尺度融合的网络模块;利用所述检测头部网络根据所述稳态多尺度均衡特征进行目标检测。
在上述方法中,特征求解器迭代求解特征变换模块所表征的隐函数的、关于多尺度均衡特征的不动点方程的过程,在逻辑上可视为构建了一个堆叠有无限个特征变换模块的显式特征金字塔网络,该特征金字塔网络的输入包括多尺度基础特征以及初始的多尺度均衡特征(例如,可以初始化为全零特征),其中多尺度均衡特征每经过一个特征变换模块的处理后更新一次,该特征金字塔网络最终输出的多尺度均衡特征也就相当于不动点求解结果(即稳态多尺度均衡特征)。
基于上面的分析,该方法的优势在于:其一,由于隐式特征金字塔网络在逻辑上等效于堆叠了无限多个特征变换模块的显式特征金字塔网络(特征变换模块在功能上可视为一个跨尺度连接模块),所以其增大感受野的效果优于现有技术,有利于提高目标检测精度;其二,现有技术中的各个跨尺度连接模块间的参数是不共享的,堆叠过多后会导致模型参数负担过大、模型的实用价值降低,而对于隐式特征金字塔网络中的特征变换模块,其参数在迭代求解的不同轮次之间是共享的,从而显著减轻了模型的参数负担;其三,隐式特征金字塔网络虽然在逻辑上等效于无限深的显式特征金字塔网络,但实际上隐式特征金字塔网络中只包含一个特征变换模块,并没有实际堆叠大量的跨尺度连接模块,从而显著降低了网络运算中对计算资源(例如,显存)的需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461779.9/2.html,转载请声明来源钻瓜专利网。