[发明专利]一种深度学习网络模型的构建方法及应用在审
申请号: | 202210774165.9 | 申请日: | 2022-07-01 |
公开(公告)号: | CN115294196A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 王森;李茂;陈明方;林森;吴锦秀;柴尚磊;杨荣良;王庆健;祝阳;郉开哲 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06V10/44;G06V10/764;G06V10/82;G01H9/00;G06N3/04;G06N3/08 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 陈波 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 网络 模型 构建 方法 应用 | ||
1.一种深度学习网络模型的构建方法,其特征在于:利用CSPDarknet特征提取的骨干网络、注意力机制模块、PAFPN模块和头部定位模块构建深度学习网络模型。
2.根据权利要求1所述的深度学习网络模型的构建方法,其特征在于:所述CSPDarknet特征提取的骨干网络包括Focus模块、4个CBS模块、SPP模块、4个CSPLayer模块;在特征提取部分新增加一个浅层特征层输出,即通过特征提取模块获得S1、S2、S3、S4。
3.根据权利要求2所述的深度学习网络模型的构建方法,其特征在于:所述4个CSPLayer模块中Bottleneck模块的数量依次分别为1、3、3、1。
4.根据权利要求1所述的深度学习网络模型的构建方法,其特征在于:将骨干网络输出的特征图S1、S2、S3、S4经过注意力机制模块,获得特征图X1、X2、X3、X4。
5.根据权利要求1所述的深度学习网络模型的构建方法,其特征在于:PAFPN模块分为自顶向下和自底向上的双向融合过程;依据注意力机制模块输出的特征图X1、X2、X3、X4,通过自顶向下过程得到特征图C1、C2、C3、C4;依据C1、C2、C3、C4通过自底向上过程得到特征图P1、P2、P3、P4。
6.根据权利要求1所述的深度学习网络模型的构建方法,其特征在于:所述头部定位模块对PAFPN模块输出的特征图P1、P2、P3、P4先各自通过一个C1BS模块,得到分类部分和回归部分;然后将这2个部分分别通过两个C3BS模块,回归部分得到回归分支和背景分支,分类部分得到分类分支;将3个分支分别通过一个1×1的卷积,获得分支的预测结果;其中,C1BS模块表示采用1×1卷积,C3BS模块表示采用3×3卷积;通过KL散度来代替回归分支的原水平框的IOUloss损失函数。
7.根据权利要求6所述的深度学习网络模型的构建方法,其特征在于:所述回归分支用于获得特征点的回归参数,即判断目标区域的候选框位置;背景分支用于判断特征点是否包含物体;分类分支用于判断特征点所包含的目标类别。
8.一种深度学习网络模型在振动结构体中的应用,其特征在于:包括:
获取振动结构体数据集并将其划分为训练数据集和验证数据集;
通过标注工具,分别对训练数据集和验证数据集进行标注得到训练集与验证集;
采用权利要求1-7中任一项所述方法构建深度学习网络模型;
修改配置文件中的超参数,获得训练参数;
调用训练集和配置文件开始对深度学习网络模型进行训练,训练结束获得候选权重;
用验证集对候选权重性能进行评估,以量化候选权重的性能,将最优权重载入深度学习网络模型,获得载入最优权重后的深度学习网络模型;
将新获取的待检测的振动结构体图像输入至载入最优权重后的深度学习网络模型进行检测,获得预测结果。
9.根据权利要求8所述深度学习网络模型在振动结构体中的应用,其特征在于:所述预测结果包括特征点的回归参数,即判断目标区域的候选框位置,共有5个参数[x,y,w1,h1,θ],在每个特征图共有h×w×5个输出;包括特征点包含目标的概率值,在每个特征图共有h×w×1个输出;还包括目标类别,在每个特征图共有h×w×m个输出;其中,x,y分别表示候选框中心点的X轴、Y轴坐标,w1,h1,θ分别表示候选框的宽度、高度、旋转角度;w,h分别表示特征图的宽度、高度,m表示目标类别的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210774165.9/1.html,转载请声明来源钻瓜专利网。