[发明专利]一种轻量化煤矸目标检测方法有效
申请号: | 202110557484.X | 申请日: | 2021-05-21 |
公开(公告)号: | CN113421222B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 杜京义;史志芒;郝乐;陈宇航;陈瑞;张兴;杨宁;池浩宇 | 申请(专利权)人: | 西安科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06N3/0464 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 刘娜 |
地址: | 710054 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量化 目标 检测 方法 | ||
1.一种轻量化煤矸目标检测方法,其特征在于,具体按照以下步骤实施:
步骤1,数据集采集与标注:在不同光照条件下采集煤矸图片,形成煤矸数据集;
步骤2,利用轻量化特征提取网络,提取煤矸图片的多尺度特征;
具体为:以SSD特征提取网络为基础,利用GhostNet的Conv1、GB Neck2、GB Neck3、GBNeck4、GB Neck5作为SSD特征提取网络的主体网络层提取任意一张煤矸图片的浅层特征,主体网络层输出特征图的尺寸为19×19×112,设置GhostNet的基本结构Ghost模块中利用线性变换生成特征图的个数s=2,再经过扩展层Conv6、Conv7、Conv8、Conv9四个卷积块提取特征图的深层特征;
步骤3,应用自注意力分支对浅层特征图进行特征增强;具体过程如下:
步骤301、提取38×38、19×19两种尺度的浅层特征图作为输入,经过自注意力模块输出,将每张特征图x∈Rh×w×c分别经过q,k,v三个分支,q,k两条分支使用扩张卷积对输入特征图进行尺度压缩,得到输出q(x)∈Rh×w×c/8、k(x)∈Rh×w×c/8卷积核的个数分别为c/8、c/8,扩张率分别为1、3,将q,k两条分支的扩张卷积输出q(x)、k(x)的维度变换为q(x)∈RN×c/t、k(x)∈RN×c/t,经过矩阵相乘运算、softmax运算得出注意力图θ(x)∈RN×N,v分支使用扩张卷积对输入特征图进行特征提取,得到输出ν(x)∈Rh×w×c,卷积核的个数为c,扩张率为5,将v分支扩张卷积输出ν(x)维度变换为RN×c,再与注意力图θ(x)相乘,将相乘结果进行维度变换,最后与输出特征图x进行shortcut连接,得到自注意力特征图y∈Rh×w×c;
步骤302、分别以步骤301得到的两个自注意力特征图y为输入,利用1×1卷积实现特征跨通道的交互和信息整合;38×38、19×19两种尺度特征图对应分支1×1卷积核个数分别为40、120;
步骤4,利用修改后的锚框参数生成每种尺度特征图对应的锚框;
具体为:利用K-means对煤矸数据集进行聚类,使用每个anchorbox与聚类中心框的交并比IOU作为度量标准,采用的度量公式为d(box,centroid)=1-IOU(box,centroid),其中box代表真实标注框的集合,centroid代表聚类中心框的集合,设置聚类簇数k=6,通过对数据集聚类得到锚框的纵横比aspect_ratios=[ar1,ar2,ar3,ar4,ar5,ar6],根据聚类结果对锚框尺寸参数进行修改,并将六种尺度网格点生成锚框的个数改为[6,6,6,6,6,6];
6种尺度特征图归一化尺度参数计算公式如式(1)所示;
式(1)中,sk表示第k个特征图的归一化尺度参数;smin是最小归一化尺寸,取值为0.2,smax是最大归一化尺寸,取值为0.9;m表示特征图的个数,取值为6;
第k种尺度特征图对应的6个锚框尺寸的计算公式,如式(2)所示,则得到第k种尺度特征图对应的6个锚框尺寸{(w1,h1),(w2,h2),(w3,h3),(w4,h4),(w5,h5),(w6,h6)};
其中,wi、hi分别表示由aspect_ratios中第i个纵横比计算得到锚框的宽和高;
步骤5,以SSD目标检测模型为基本框架,构建改进SSD煤矸目标检测模型;
步骤6,对模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110557484.X/1.html,转载请声明来源钻瓜专利网。