[发明专利]基于改进YOLOX模型的小目标检测方法在审

专利信息
申请号: 202210822351.5 申请日: 2022-07-13
公开(公告)号: CN115063672A 公开(公告)日: 2022-09-16
发明(设计)人: 晁人傑;邓亮;郑卓斌;王立磊;刘若辰 申请(专利权)人: 广州科语机器人有限公司
主分类号: G06V20/00 分类号: G06V20/00;G06V10/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08
代理公司: 广东北定知识产权代理事务所(普通合伙) 44761 代理人: 曹江雄
地址: 511470 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 改进 yolox 模型 目标 检测 方法
【权利要求书】:

1.基于改进YOLOX模型的小目标检测方法,其特征在于,所述方法包括:

获取待检测图像;

对所述待检测图像进行特征提取,得到多个初始特征;

将所述多个初始特征进行跨层特征融合,得到多个融合特征;

将所述多个融合特征进行预测处理,根据处理结果得到所述待检测图像的小目标检测结果。

2.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像进行特征提取,得到多个初始特征,包括:

对所述待检测图像进行识别,得到所述待检测图像中的待检测目标尺寸;

若特征提取检测头的感受野大于所述待检测目标尺寸,对所述待检测图像进行特征提取,得到多个初始特征。

3.根据权利要求2所述的方法,其特征在于,所述对所述待检测图像进行特征提取,得到多个初始特征,包括:

将所述待检测图像依次输入改进YOLOX模型的Focus模块和与所述Focus模块串联的多个卷积模块进行特征提取,得到所述多个初始特征。

4.根据权利要求3所述的方法,其特征在于,包括:所述多个卷积模块中的每个卷积模块包括Dark模块和注意力机制模块,所述注意力机制模块后的嵌入位置配置有检测头。

5.根据权利要求1所述的方法,其特征在于,所述将所述多个初始特征进行特征融合,得到多个融合特征,包括:

将所述多个初始特征按照预先配置的跨层连接位置进行特征融合,得到所述多个融合特征;

其中,所述跨层连接位置根据所述多个卷积模块和所述改进YOLOX模型的多个特征融合模块的相对位置关系配置得到。

6.根据权利要求3所述的方法,其特征在于,所述基于所述多个融合特征进行预测处理,根据处理结果得到所述待检测图像的小目标检测结果,包括:

对所述多个融合特征进行预测处理,根据处理结果得到所述小目标检测结果。

7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:

获取初始图像数据集,所述初始图像数据集包括训练集和验证集;

将所述训练集输入至待训练的改进YOLOX模型进行训练,通过所述验证集对改进YOLOX模型进行验证;

更新所述改进YOLOX模型的模型参数直至模型收敛,得到训练后的改进YOLOX模型。

8.根据权利要求7所述的方法,其特征在于,所述将所述训练集输入至待训练的改进YOLOX模型进行训练之前,所述方法还包括:

获取原始改进YOLOX模型;

将所述原始改进YOLOX模型的网络偏移量初始化为0,通过Kaiming高斯初始化方法对所述原始改进YOLOX模型的网络权重参数进行初始化。所述Kaiming高斯初始化方法服从以下分布;

其中,Wl为第l层权重,N为高斯分布,a为ReLU激活函数,nl为第l层的数据维度。

9.根据权利要求7所述的方法,其特征在于,所述更新所述改进YOLOX模型的模型参数直至模型收敛,包括:

针对训练中的每一次迭代,根据迭代前的梯度和损失函数得到迭代后的梯度,并根据所述迭代后的梯度执行下一次迭代,直至训练完全部测试集。所述梯度包括改进YOLOX模型的权重和偏移量;

针对训练中每一轮训练完全部训练集,将前一次的模型参数进行指数滑动平均,以得到所述改进YOLOX模型新的模型参数,根据所述新的模型参数更新所述改进YOLOX模型,直至模型收敛或达到最大训练轮次。

10.根据权利要求9所述的方法,其特征在于,所述方法还包括:

通过如下算法获取训练中的改进YOLOX模型的权重:

其中,Wt和Wt+1为第t次迭代和第t+1次迭代的权重,mW为反向传播算法的学习率,为损失函数对权重W的偏导数;

以及,通过如下算法获取训练中的改进YOLOX模型的偏移量:

其中,bt和bt+1为第t次迭代和第t+1次迭代的偏移量,mb为反向传播算法的学习率,为损失函数对偏移量b的偏导数;

以及,每轮训练完后通过下列算法对该轮训练后的改进YOLOX模型的模型参数进行指数滑动平均(EMA):

其中,WEMA,k、bEMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的参数值,a为衰减因子,为第k-1轮训练后的权重和偏移量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州科语机器人有限公司,未经广州科语机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210822351.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top