[发明专利]基于多表征特征提取法进行目标检测的方法在审
申请号: | 202211273861.8 | 申请日: | 2022-10-18 |
公开(公告)号: | CN116206123A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 朱佳梅;任洪娥;薛龄季轩;孙毅;张健沛 | 申请(专利权)人: | 哈尔滨石油学院 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/82;G06V10/80;G06N3/0464;G06N3/08 |
代理公司: | 哈尔滨三目知识产权代理事务所(普通合伙) 23214 | 代理人: | 刘冰 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 表征 特征 提取 进行 目标 检测 方法 | ||
基于多表征特征提取法进行目标检测的方法,属于目标检测算法领域。现有的目标检测方法不能完全发挥混合特征的多表征优势,候选区域生成算法耗费大量计算资源,严重影响目标检测的实时性。基于多表征特征提取法进行目标检测的方法,基于图像空间域和频域信息的多表征特征提取算法提取完备的图像特征,生成包含完备表征信息的特征图;区域建议网络利用多表征特征图预测可能出现目标的区域作为候选区域;待选区结合骨干网络生成的多表征特征图进行区域最大池化生成目标特征向量,并用来计算目标类型概率和目标边界框回归参数;目标检测。实现在不同场景下目标检测任务,并达到精准的效果。
技术领域
本发明涉及一种目标检测方法,特别涉及一种基于多表征特征提取法进行目标检测的方法。
背景技术
图像的空间域信息常被用于进行各项计算机视觉任务,如图像分类、图像分割和目标检测等。在目标检测算法中,单纯通过空间域信息用于提取图像特征,会因空间信息受光线、遮挡等问题使目标检测产生精度损失。目标检测算法涉及的深度学习模型在训练过程中通常批量输入多个样本,并通过GPU实现并行运算提高训练速度。数据集中经常出现尺度大小不相等的样本,这导致无法使用批量训练。
现有图像的频域信息特征提取的技术中,由于传统深度神经网络的运算算子都是实值的,因此目前性能良好的深度神经网络算法架构不能直接应用于图像频域空间信息。
所以考虑将空间域信息和频域信息融合作为提取的特征。但直接通过空间域和频域信息生成的融合特征表示空间维度低,以至于并不能完全发挥混合特征的多表征优势。
另外,在目标检测过程涉及的候选区域生成算法,现有采用滑动窗口和选择搜索等方法生成目标边界框。但是,这类方法耗费大量的计算资源,严重影响目标检测的实时性。
本申请针对空间域信息和频域信息特征融合方法、候选区域生成算法进行改进,并对目标检测的方法从整体上重新进行设计,以提高目标检测精度。
发明内容
本发明的目的是为了解决现有的目标检测方法不能完全发挥混合特征的多表征优势的问题,以及候选区域生成算法过程中,一个窗口只能预测一个目标,并且耗费大量的计算资源,严重影响目标检测的实时性的问题,而提出基于多表征特征提取法进行目标检测的方法。
上述目的通过以下的技术方案实现:
基于多表征特征提取法进行目标检测的方法,所述方法通过以下步骤实现:
步骤一、视频或图像被输入到基于多表征特征提取的骨干网络,基于图像空间域和频域信息的多表征特征提取算法提取完备的图像特征,生成包含完备表征信息的特征图;包括:
步骤一一、数据预处理的步骤:
将数据集中的样本通过数据预转换为标准的输入格式;
步骤一二、空间域信息特征提取的步骤:
设经过标准化处理后的图像映射为空间域信息Is(x,y),并直接输入到空间域子网,得到空间域特征图Fs;
步骤一三、频域信息特征提取的步骤:
采用快速傅里叶变换将标准化后的图像从空间域转换为频域信息If(u,v);其中,经过傅里叶变换的频域信息与空间域信息之间的映射关系为:
其中,M和N代表输入图像的长度和宽度;
之后,图像的频域信息If(u,v)输入至频域子网,提取不同频段的特征,得到频域特征图Ff;
至此,经过数据预处理之后的图像信息分别输入空间信息特征提取分支和频域信息特征提取分支并完成特征提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨石油学院,未经哈尔滨石油学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211273861.8/2.html,转载请声明来源钻瓜专利网。