[发明专利]基于改进YOLOX模型的小目标检测方法在审
申请号: | 202210822351.5 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115063672A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 晁人傑;邓亮;郑卓斌;王立磊;刘若辰 | 申请(专利权)人: | 广州科语机器人有限公司 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 广东北定知识产权代理事务所(普通合伙) 44761 | 代理人: | 曹江雄 |
地址: | 511470 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 yolox 模型 目标 检测 方法 | ||
1.基于改进YOLOX模型的小目标检测方法,其特征在于,所述方法包括:
获取待检测图像;
对所述待检测图像进行特征提取,得到多个初始特征;
将所述多个初始特征进行跨层特征融合,得到多个融合特征;
将所述多个融合特征进行预测处理,根据处理结果得到所述待检测图像的小目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像进行特征提取,得到多个初始特征,包括:
对所述待检测图像进行识别,得到所述待检测图像中的待检测目标尺寸;
若特征提取检测头的感受野大于所述待检测目标尺寸,对所述待检测图像进行特征提取,得到多个初始特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述待检测图像进行特征提取,得到多个初始特征,包括:
将所述待检测图像依次输入改进YOLOX模型的Focus模块和与所述Focus模块串联的多个卷积模块进行特征提取,得到所述多个初始特征。
4.根据权利要求3所述的方法,其特征在于,包括:所述多个卷积模块中的每个卷积模块包括Dark模块和注意力机制模块,所述注意力机制模块后的嵌入位置配置有检测头。
5.根据权利要求1所述的方法,其特征在于,所述将所述多个初始特征进行特征融合,得到多个融合特征,包括:
将所述多个初始特征按照预先配置的跨层连接位置进行特征融合,得到所述多个融合特征;
其中,所述跨层连接位置根据所述多个卷积模块和所述改进YOLOX模型的多个特征融合模块的相对位置关系配置得到。
6.根据权利要求3所述的方法,其特征在于,所述基于所述多个融合特征进行预测处理,根据处理结果得到所述待检测图像的小目标检测结果,包括:
对所述多个融合特征进行预测处理,根据处理结果得到所述小目标检测结果。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
获取初始图像数据集,所述初始图像数据集包括训练集和验证集;
将所述训练集输入至待训练的改进YOLOX模型进行训练,通过所述验证集对改进YOLOX模型进行验证;
更新所述改进YOLOX模型的模型参数直至模型收敛,得到训练后的改进YOLOX模型。
8.根据权利要求7所述的方法,其特征在于,所述将所述训练集输入至待训练的改进YOLOX模型进行训练之前,所述方法还包括:
获取原始改进YOLOX模型;
将所述原始改进YOLOX模型的网络偏移量初始化为0,通过Kaiming高斯初始化方法对所述原始改进YOLOX模型的网络权重参数进行初始化。所述Kaiming高斯初始化方法服从以下分布;
其中,Wl为第l层权重,N为高斯分布,a为ReLU激活函数,nl为第l层的数据维度。
9.根据权利要求7所述的方法,其特征在于,所述更新所述改进YOLOX模型的模型参数直至模型收敛,包括:
针对训练中的每一次迭代,根据迭代前的梯度和损失函数得到迭代后的梯度,并根据所述迭代后的梯度执行下一次迭代,直至训练完全部测试集。所述梯度包括改进YOLOX模型的权重和偏移量;
针对训练中每一轮训练完全部训练集,将前一次的模型参数进行指数滑动平均,以得到所述改进YOLOX模型新的模型参数,根据所述新的模型参数更新所述改进YOLOX模型,直至模型收敛或达到最大训练轮次。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
通过如下算法获取训练中的改进YOLOX模型的权重:
其中,Wt和Wt+1为第t次迭代和第t+1次迭代的权重,mW为反向传播算法的学习率,为损失函数对权重W的偏导数;
以及,通过如下算法获取训练中的改进YOLOX模型的偏移量:
其中,bt和bt+1为第t次迭代和第t+1次迭代的偏移量,mb为反向传播算法的学习率,为损失函数对偏移量b的偏导数;
以及,每轮训练完后通过下列算法对该轮训练后的改进YOLOX模型的模型参数进行指数滑动平均(EMA):
其中,WEMA,k、bEMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的参数值,a为衰减因子,为第k-1轮训练后的权重和偏移量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州科语机器人有限公司,未经广州科语机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210822351.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:返利金额的确定方法、第一终端和返利系统
- 下一篇:配置页面生成方法及装置