[发明专利]一种目标检测方法、系统、设备及存储介质在审
申请号: | 202211475062.9 | 申请日: | 2022-11-23 |
公开(公告)号: | CN115761386A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 张宾;孙喜民;李晓明;常江;马国瑜;魏晓鹏 | 申请(专利权)人: | 国网数字科技控股有限公司;国网电商科技有限公司 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/82;G06N3/0464 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 高勇 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 系统 设备 存储 介质 | ||
本发明实施例提供了一种目标检测方法、系统、设备及存储介质,其中,方法包括:利用预设卷积神经网络对获得的目标图像进行特征提取,获得第一特征图,利用所述预设卷积神经网络中的预设全局自注意力模块,对所述第一特征图进行全局自注意力计算,获得第二特征图,将所述第二特征图的图像矩阵转换为目标维度矩阵,并将所述目标维度矩阵输入至预设目标检测模型中进行目标检测。本发明提高了对图像内目标的检测效率。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种目标检测方法、系统、设备及存储介质。
背景技术
Detection transformer(DETR)模型是一种用于对图像内的目标进行检测的模型。在利用DETR模型对图像进行目标检测时,会利用卷积网络对图像特征进行特征提取。由于经过特征提取的特征图的图像维度仍不满足目标检测网络(transformer)的输入要求。因此DETR模型需要将获得的特征图进行图像切分后,将多个特征图快输入入到目标检测网络中进行目标检测。
但是,由于DETR模型在将切分后的多个特征图块输入目标检测网络前,并未计算特征图的全局注意力。致使目标检测网络需要将各特征图块进行还原,并通过叠加大量编码层的方式来实现全局注意力的计算。这就导致现有的目标检测模型对图像内目标的检测效率低下。
发明内容
本发明实施例的目的在于提供一种目标检测方法、系统、设备及存储介质,以实现提高对图像内目标的检测效率的发明目的。具体技术方案如下:
一种目标检测方法,所述方法包括:
利用预设卷积神经网络对获得的目标图像进行特征提取,获得第一特征图;
利用所述预设卷积神经网络中的预设全局自注意力模块,对所述第一特征图进行全局自注意力计算,获得第二特征图;
将所述第二特征图的图像矩阵转换为目标维度矩阵,并将所述目标维度矩阵输入至预设目标检测模型中进行目标检测。
可选的,所述利用所述预设卷积神经网络中的预设全局自注意力模块,对所述第一特征图进行全局自注意力计算,获得第二特征图,包括:
利用所述预设全局自注意力模块的降维卷积核,对所述第一特征图的图像矩阵进行降维处理,获得第一图像矩阵;
利用预设维度转换函数,对所述第一图像矩阵分别进行两次不同的维度转换,获得的第二图像矩阵和第三图像矩阵;
对所述第二图像矩阵和第三图像矩阵进行乘积运算,获得特征权重矩阵;
利用预设卷积核,对所述第一图像矩阵进行卷积运算,获得第四图像矩阵,将第四图像矩阵与所述特征权重矩阵进行乘积运算,获得全局注意力矩阵;
利用所述预设全局自注意力模块的升维卷积核,对所述全局注意力矩阵进行升维处理,获得所述第二特征图。
可选的,所述将所述第二特征图的图像矩阵转换为目标维度矩阵,并将所述目标维度矩阵输入至预设目标检测模型中进行目标检测,包括:
利用所述预设维度转换函数,对所述第二特征图的图像矩阵进行维度拉平操作,获得所述目标维度矩阵;
将所述目标维度矩阵输入至所述预设目标检测模型的编码器,以使所述编码器对所述目标维度矩阵进行向量编码操作;将经过所述向量编码操作的所述目标维度矩阵输入至所述预设目标检测模型的解码器中进行所述目标检测。
可选的,所述向量编码操作,包括:
所述编码器将预设位置编码矩阵与所述目标维度矩阵进行叠加,以使所述目标维度矩阵的各元素均携带有对应的位置编码信息,其中,所述位置编码信息包括绝对位置编码和相对位置编码。
一种目标检测系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网数字科技控股有限公司;国网电商科技有限公司,未经国网数字科技控股有限公司;国网电商科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211475062.9/2.html,转载请声明来源钻瓜专利网。