[发明专利]一种基于神经网络目标检测的厂区工装检测方法及系统在审
申请号: | 202210877409.6 | 申请日: | 2022-07-25 |
公开(公告)号: | CN115131339A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 林旭;李密;陈旭;陈佳期;唐光铁;曾远强;卢雨畋;周小报 | 申请(专利权)人: | 福建省海峡智汇科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361112 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 目标 检测 厂区 工装 方法 系统 | ||
1.一种基于神经网络目标检测的厂区工装检测方法,其特征在于,包括以下步骤:
S1、获取多张工作服样本图像,对所述工作服样本图像标注标签,将全部的所述工作服样本图像及其对应的标签确定为训练样本数据集;
S2、将所述训练样本数据集按比例划分为训练集、验证集和测试集;
S3、构建目标检测模型:将所述训练样本数据集中的图像输入到backbone网络中,根据所述backbone网络中的三层输出,在neck层通过Rep-PAN网络继续输出三层不同尺寸大小的特征图,将所述特征图输入到head层中,并且对所述特征图进行三类任务预测;构建所述目标检测模型的损失函数;
S4、将所述训练集输入到构建好的所述目标检测模型中进行训练,所述损失函数不断迭代至收敛,获得最优网络权重,所述目标检测模型通过所述验证集进行预测,并通过所述测试集进行测试验证;以及
S5、设置固定阈值,并根据所述固定阈值输出目标检测结果。
2.根据权利要求1一种基于神经网络目标检测的厂区工装检测方法,其特征在于,在步骤S3中,将所述训练样本数据集中的图像输入到backbone网络中,包括以下子步骤:
S311、输入640*640*3的所述训练样本数据集中的图像到所述backbone网络中,通过stem层输出为320*320*3*2的图像;
S312、所述stem层连接多个ERBlock,每个所述ERBlock均做特征层的下采样和channel的增大,每个所述ERBlock由一个RVB和一个RB组成,在所述RVB中做特征层的下采样,同时channel增大,在所述RB中对特征层充分融合后输出;以及
S313、最后,所述backbone网络输出三个特征图。
3.根据权利要求1一种基于神经网络目标检测的厂区工装检测方法,其特征在于,在步骤S3中,在neck层通过Rep-PAN网络继续输出三层不同尺寸大小的特征图,包括以下子步骤:
S321、从ERB5输出20*20*512的特征图,通过SConv将所述特征图变成20*20*128大小,上采样后真实框高度h和真实框宽度w增大一倍后与ERB4的输出特征图在channel层上进行特征融合后,所述特征图的尺寸变成40*43*84,通过RB后,输出40*40*128特征图;
S322、重复执行步骤S321后,输出第一个所述特征图;
S323、将80*80*64的特征图先通过所述SConv下采样,得到40*40*64的特征图,与步骤S321中的真实框高度h和真实框宽度w一致的特征图在channel层上特征融合后,通过RB后,输出第二个所述特征图;以及
S324、重复执行步骤S323,输出第三个所述特征图。
4.根据权利要求1一种基于神经网络目标检测的厂区工装检测方法,其特征在于,在步骤S3中,将所述特征图输入到head层中,并且对所述特征图进行三类任务预测,包括以下子步骤:
S331、从neck层输出三个分支,对于每个分支,先对输出的所述特征图通过BConv层,进行所述特征图的特征融合;
S332、对步骤S331中进行所述特征图的特征融合后,分成两个分支,一个分支通过BConv+Conv完成分类任务的预测,另外一个分支先通过BConv融合特征后再分成两个分支,一个分支通过Conv完成边框的回归,另一个分支通过Conv完成前后背景的分类;以及
S333、三个分支再通过channel层进行特征融合,输出预测结果。
5.根据权利要求1一种基于神经网络目标检测的厂区工装检测方法,其特征在于,在步骤S120中,将所述训练样本数据集按8:1:1的比例划分为训练集、验证集和测试集。
6.根据权利要求1一种基于神经网络目标检测的厂区工装检测方法,其特征在于,在步骤S3中,所述损失函数为SIOU损失函数,表达式为:
SIOU=DIOU+βv
其中,DIOU是距离损失函数,β是权重系数,v用来衡量预测框和真实框之间的长宽比的相似性;
其中,w、h分别是预测框和真实框对应的宽度和高度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建省海峡智汇科技有限公司,未经福建省海峡智汇科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210877409.6/1.html,转载请声明来源钻瓜专利网。