[发明专利]一种基于渐进式候选框高亮的检测方法、设备和介质在审
申请号: | 202210391460.6 | 申请日: | 2022-04-14 |
公开(公告)号: | CN114821036A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 张云霄;叶齐祥;郭宗昊 | 申请(专利权)人: | 中国科学院大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京康思博达知识产权代理事务所(普通合伙) 11426 | 代理人: | 潘炜 |
地址: | 100049 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 渐进 候选 框高亮 检测 方法 设备 介质 | ||
1.一种基于渐进式候选框高亮的检测方法,其特征在于,将图像输入检测器中,通过检测器识别图像中目标,获得目标在图像中位置。
2.根据权利要求1所述的基于渐进式候选框高亮的检测方法,其特征在于,
所述检测器通过以下步骤进行图像中目标位置的识别:
S1、通过Conformer网络提取图像的候选框嵌入向量与特征向量;
S2、根据候选框嵌入向量获得目标候选框;
S3、通过区域特征聚集对目标候选框内的特征向量进行提取,获得局部特征向量;
S4、将候选框嵌入向量与局部特征向量融合,获得新的候选框嵌入向量;
S5、以新的候选框嵌入向量替代原有的候选框嵌入向量,依次重复步骤S2~S4,经过多次重复,获得图像中目标所在位置,所述位置通过最后一次获得的目标候选框标示出来。
3.根据权利要求2所述的基于渐进式候选框高亮的检测方法,其特征在于,
在S2中,通过感知层对初始目标边界框进行修正,获得目标边界框,所述初始目标边界框由Conformer网络生成。
4.根据权利要求3所述的基于渐进式候选框高亮的检测方法,其特征在于,
所述感知层的参数为利用候选框嵌入向量,通过最小化匹配损失法训练获得,包括以下步骤:
S21、将候选框嵌入向量输入线性层获得预测分类分数;
S22、通过将候选框嵌入向量输入感知层得到边界框偏移量,通过边界框偏移量对初始目标边界框进行修正,获得预测边界框;
S23、预测边界框与预测分类分数组合成预测集合R,将预测集合R与真值目标集合进行匹配,通过最小化匹配损失更新并获得感知层的参数。
5.根据权利要求4所述的基于渐进式候选框高亮的检测方法,其特征在于,
S23中,通过匈牙利法实现最小化匹配损失,其中匹配的损失函数为分类损失函数、目标定位L1损失函数和GioU损失函数的加权和;
分类损失函数表征预测分类分数与真值目标分类分数的损失;目标定位L1损失函数和GioU损失函数表征预测边界框与真值目标边界框的损失。
6.根据权利要求2所述的基于渐进式候选框高亮的检测方法,其特征在于,
在S3中,通过RoIAlign方法对特征向量进行提取,获得局部特征向量。
7.根据权利要求2所述的基于渐进式候选框高亮的检测方法,其特征在于,
在S4中,所述融合包括以下子步骤:
S41、通过线性层将候选框嵌入向量增强至I个,形成嵌入向量集;
S42、将候选框嵌入向量集和局部特征向量通过交叉注意力方法进行增强,获得增强特征向量;
S43、将增强特征向量输入卷积层,获得新的候选框嵌入向量。
8.根据权利要求7所述的基于渐进式候选框高亮的检测方法,其特征在于,
在S42中,所述交叉注意力方法可以表示为:
其中,为增强特征向量,fi为局部特征向量,eφi为嵌入向量集,θq、θk、θv为线性转换层参数,C表示特征向量的维度,h′为超参数,上标T表示转置。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
10.一种存储有计算机指令的计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大学,未经中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210391460.6/1.html,转载请声明来源钻瓜专利网。