[发明专利]基于改进YOLOX模型的小目标检测方法在审

申请号：	202210822351.5	申请日：	2022-07-13
公开（公告）号：	CN115063672A	公开（公告）日：	2022-09-16
发明（设计）人：	晁人傑;邓亮;郑卓斌;王立磊;刘若辰	申请（专利权）人：	广州科语机器人有限公司
主分类号：	G06V20/00	分类号：	G06V20/00;G06V10/40;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08
代理公司：	广东北定知识产权代理事务所(普通合伙) 44761	代理人：	曹江雄
地址：	511470 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于改进 yolox 模型目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于改进YOLOX模型的小目标检测方法，其特征在于，所述方法包括：

获取待检测图像；

对所述待检测图像进行特征提取，得到多个初始特征；

将所述多个初始特征进行跨层特征融合，得到多个融合特征；

将所述多个融合特征进行预测处理，根据处理结果得到所述待检测图像的小目标检测结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述待检测图像进行特征提取，得到多个初始特征，包括：

对所述待检测图像进行识别，得到所述待检测图像中的待检测目标尺寸；

若特征提取检测头的感受野大于所述待检测目标尺寸，对所述待检测图像进行特征提取，得到多个初始特征。

3.根据权利要求2所述的方法，其特征在于，所述对所述待检测图像进行特征提取，得到多个初始特征，包括：

将所述待检测图像依次输入改进YOLOX模型的Focus模块和与所述Focus模块串联的多个卷积模块进行特征提取，得到所述多个初始特征。

4.根据权利要求3所述的方法，其特征在于，包括：所述多个卷积模块中的每个卷积模块包括Dark模块和注意力机制模块，所述注意力机制模块后的嵌入位置配置有检测头。

5.根据权利要求1所述的方法，其特征在于，所述将所述多个初始特征进行特征融合，得到多个融合特征，包括：

将所述多个初始特征按照预先配置的跨层连接位置进行特征融合，得到所述多个融合特征；

其中，所述跨层连接位置根据所述多个卷积模块和所述改进YOLOX模型的多个特征融合模块的相对位置关系配置得到。

6.根据权利要求3所述的方法，其特征在于，所述基于所述多个融合特征进行预测处理，根据处理结果得到所述待检测图像的小目标检测结果，包括：

对所述多个融合特征进行预测处理，根据处理结果得到所述小目标检测结果。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

获取初始图像数据集，所述初始图像数据集包括训练集和验证集；

将所述训练集输入至待训练的改进YOLOX模型进行训练，通过所述验证集对改进YOLOX模型进行验证；

更新所述改进YOLOX模型的模型参数直至模型收敛，得到训练后的改进YOLOX模型。

8.根据权利要求7所述的方法，其特征在于，所述将所述训练集输入至待训练的改进YOLOX模型进行训练之前，所述方法还包括：

获取原始改进YOLOX模型；

将所述原始改进YOLOX模型的网络偏移量初始化为0，通过Kaiming高斯初始化方法对所述原始改进YOLOX模型的网络权重参数进行初始化。所述Kaiming高斯初始化方法服从以下分布；

其中，W_l为第l层权重，N为高斯分布，a为ReLU激活函数，n_l为第l层的数据维度。

9.根据权利要求7所述的方法，其特征在于，所述更新所述改进YOLOX模型的模型参数直至模型收敛，包括：

针对训练中的每一次迭代，根据迭代前的梯度和损失函数得到迭代后的梯度，并根据所述迭代后的梯度执行下一次迭代，直至训练完全部测试集。所述梯度包括改进YOLOX模型的权重和偏移量；

针对训练中每一轮训练完全部训练集，将前一次的模型参数进行指数滑动平均，以得到所述改进YOLOX模型新的模型参数，根据所述新的模型参数更新所述改进YOLOX模型，直至模型收敛或达到最大训练轮次。

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

通过如下算法获取训练中的改进YOLOX模型的权重：

其中，W_t和W_t+1为第t次迭代和第t+1次迭代的权重，m_W为反向传播算法的学习率，为损失函数对权重W的偏导数；

以及，通过如下算法获取训练中的改进YOLOX模型的偏移量：

其中，b_t和b_t+1为第t次迭代和第t+1次迭代的偏移量，m_b为反向传播算法的学习率，为损失函数对偏移量b的偏导数；

以及，每轮训练完后通过下列算法对该轮训练后的改进YOLOX模型的模型参数进行指数滑动平均(EMA)：

其中，W_EMA,k、b_EMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的参数值，a为衰减因子，为第k-1轮训练后的权重和偏移量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州科语机器人有限公司，未经广州科语机器人有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210822351.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载