[发明专利]一种基于深度学习的目标检测方法和系统在审
申请号: | 202010442301.5 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111626349A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 付琨;闫志远;张晓安;陈凯强;赵良瑾;朱子聪;李霁豪;卢宛萱 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 目标 检测 方法 系统 | ||
1.一种基于深度学习的目标检测方法,其特征在于,包括:
获取包括待检测目标的待检图像;
将所述待检图像输入训练完成的骨干网络生成热力图,并确定所述热力图的边缘信息;
基于所述边缘信息得到预测框;
其中,所述骨干网络的训练基于选择的骨干网络按批次对已识别目标类型和位置信息的图像进行训练并调整后处理过程中所需超参数,所述超参数包括:输出预测的最大数量和置信度阈值。
2.如权利要求1所述的方法,其特征在于,所述骨干网络的训练包括:
获取已经识别目标类型和位置信息的多个图像,将各图像与图像中目标对应的类型和位置信息构成训练数据集;
按需求选择合适的骨干网络,初始化骨干网络参数,调整后处理过程中模型所需超参数;
将训练数据集按批次输入骨干网络进行训练,基于骨干网络输出热力图的边缘信息,利用损失函数对骨干网络进行训练直到所述骨干网络收敛。
3.如权利要求2所述的方法,其特征在于,所述将训练数据集按批次输入骨干网络进行训练,基于骨干网络输出热力图的边缘信息,利用损失函数对骨干网络进行训练直到所述骨干网络收敛,包括:
步骤a1:将训练数据集按批次输入所述骨干网络,得到包含目标上关键点的热力图;
步骤a2:对热力图进行筛选,得到代表热力图中目标的边缘信息的关键候选点;
步骤a3:基于所述关键候选点计算所述目标的位置,并将计算得到位置和训练集中的位置信息输入损失函数,判断所述骨干网络是否收敛:
若收敛,则结束,否则根据梯度下降法动态更新所述骨干网络中各层神经元的权重并转入步骤a1,直到所述骨干网络收敛。
4.如权利要求3所述的方法,其特征在于,所述将计算得到位置和训练集中的位置信息输入损失函数,判断所述骨干网络是否收敛,包括:
将计算得到位置和训练集中的位置信息输入像素级焦点损失函数;
判断像素级焦点损失函数的值是否小于预设阈值,或者骨干网络在训练集上达到预期迭代次数,若任一项为是,则所述骨干网络收敛,否则不收敛。
5.如权利要求4所述的方法,其特征在于,所述像素级焦点损失函数的计算式如下:
式中,Lfl表示像素级焦点损失函数的值,y表示训练数据集中目标位置信息的标签,y′表示骨干网络根据目标的图像计算的位置的标签,α表示平衡因子,γ表示样本加权因子。
6.如权利要求2所述的方法,其特征在于,所述按照训练需求选择骨干网络形式,包括:
当训练需求侧重于检测速度时,选择基于可变形卷积上采样的残差模块系列骨干网络;
当训练要求侧重于精度和速度之间的平衡时,选择基于编解码结构的深度融合骨干网络;
当训练要求侧重于精度时,选择基于残差模块的关键点检测时间沙漏104骨干网络。
7.如权利要求1所述的方法,其特征在于,所述将所述待检图像输入训练完成的骨干网络生成热力图,并确定所述热力图的边缘信息,包括:
将所述待检图像输入训练完成的骨干网络,得到包含待测目标上关键点热力图;
对所述热力图进行筛选得到代表待测目标边缘信息关键点关键候选点;
根据代表待测目标边缘信息关键点关键候选点,得到热力图的边缘信息。
8.如权利要求7所述的方法,其特征在于,所述对所述热力图进行筛选得到代表待测目标边缘信息关键点关键候选点,包括:
在所述热力图上对每个像素点基于像素点的非极大值抑制算法进行遍历,筛选出初筛候选点;
对所述初筛候选点采用边缘融合算法筛选出能够代表待测目标边缘信息的关键候选点。
9.如权利要求1所述的方法,其特征在于,所述基于所述边缘信息得到预测框,包括:
基于所述边缘信息,通过暴力枚举的方法得到待测目标分类结果和多个检测框;
采用幽灵框抑制算法对检测框进行筛选,得到包含待测目标的预测框。
10.一种基于深度学习的目标检测系统,其特征在于,包括:图像获取模块、热力图模块和预测框模块;
所述图像获取模块,用于获取包括待检测目标的待检图像;
所述热力图模块,用于将所述待检图像输入训练完成的骨干网络生成热力图,并确定所述热力图的边缘信息;
所述预测框模块,用于基于所述边缘信息得到预测框;
其中,所述骨干网络的训练基于选择的骨干网络按批次对已识别目标类型和位置信息的图像进行训练并调整后处理过程中所需超参数,所述超参数包括:输出预测的最大数量和置信度阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010442301.5/1.html,转载请声明来源钻瓜专利网。