[发明专利]一种基于深度学习的目标检测方法和系统在审
申请号: | 202010442301.5 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111626349A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 付琨;闫志远;张晓安;陈凯强;赵良瑾;朱子聪;李霁豪;卢宛萱 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 目标 检测 方法 系统 | ||
本发明提供了一种基于深度学习的目标检测方法和系统,包括获:取包括待检测目标的待检图像;将待检图像输入训练完成的骨干网络生成热力图,并确定热力图的边缘信息;基于边缘信息得到预测框;其中,骨干网络的训练基于选择的骨干网络按批次对已识别目标类型和位置信息的图像进行训练并调整后处理过程中所需超参数,超参数包括:输出预测的最大数量和置信度阈值。本发明摒弃原有检测方法中基于预设锚框的检测机制,降低了存储中存在的大量冗余,提高了检测模型的运算效率。
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于深度学习的目标检测方法和系统。
背景技术
现有目标检测模型大多依赖预设锚框机制,通过在图像上生成大量密集且尺寸不等的预设锚框与目标真实位置匹配,再进一步分类目标并回归其精确位置。该机制既存在大量冗余,也浪费计算资源。另外,其精度严重依赖于预设锚框的长宽比和尺寸,这些超参数的选择视具体数据集中目标大小而定。因此,基于锚框机制的方法大多可移植性差。
发明内容
为克服上述现有技术的不足,本发明提出一种基于深度学习的目标检测方法,其改进之处在于,包括:
获取包括待检测目标的待检图像;
将所述待检图像输入训练完成的骨干网络生成热力图,并确定所述热力图的边缘信息;
基于所述边缘信息得到预测框;
其中,所述骨干网络的训练基于选择的骨干网络按批次对已识别目标类型和位置信息的图像进行训练并调整后处理过程中所需超参数,所述超参数包括:输出预测的最大数量和置信度阈值。
优选的,所述骨干网络的训练包括:
获取已经识别目标类型和位置信息的多个图像,将各图像与图像中目标对应的类型和位置信息构成训练数据集;
按需求选择合适的骨干网络,初始化骨干网络参数,调整后处理过程中模型所需超参数;
将训练数据集按批次输入骨干网络进行训练,基于骨干网络输出热力图的边缘信息,利用损失函数对骨干网络进行训练直到所述骨干网络收敛。
优选的,所述将训练数据集按批次输入骨干网络进行训练,基于骨干网络输出热力图的边缘信息,利用损失函数对骨干网络进行训练直到所述骨干网络收敛,包括:
步骤a1:将训练数据集按批次输入所述骨干网络,得到包含目标上关键点的热力图;
步骤a2:对热力图进行筛选,得到代表热力图中目标的边缘信息的关键候选点;
步骤a3:基于所述关键候选点计算所述目标的位置,并将计算得到位置和训练集中的位置信息输入损失函数,判断所述骨干网络是否收敛:
若收敛,则结束,否则根据梯度下降法动态更新所述骨干网络中各层神经元的权重并转入步骤a1,直到所述骨干网络收敛。
优选的,所述将计算得到位置和训练集中的位置信息输入损失函数,判断所述骨干网络是否收敛,包括:
将计算得到位置和训练集中的位置信息输入像素级焦点损失函数;
判断像素级焦点损失函数的值是否小于预设阈值,或者骨干网络在训练集上达到预期迭代次数,若任一项为是,则所述骨干网络收敛,否则不收敛。
优选的,所述像素级焦点损失函数的计算式如下:
式中,Lfl表示像素级焦点损失函数的值,y表示训练数据集中目标位置信息的标签,y′表示骨干网络根据目标的图像计算的位置的标签,α表示平衡因子,γ表示样本加权因子。
优选的,所述按照训练需求选择骨干网络形式,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010442301.5/2.html,转载请声明来源钻瓜专利网。