[发明专利]用于图像目标检测处理的锚框生成方法及轻量级目标检测方法有效
申请号: | 202010889934.0 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112101430B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 饶云波;郭毅;程奕茗;薛俊民 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 目标 检测 处理 生成 方法 轻量级 | ||
1.用于图像目标检测处理的锚框生成方法,其特征在于,包括下列步骤:
101:通过真实数据集的目标的真实框分布情况,确定真实框的长和宽;
102:在真实框的长和宽所在的二维平面,基于每个真实框的长和宽的值得到表征每个真实框的点,基于所有真实框的点到点集P;
103:基于点集P,对真实框进行聚类处理:
103-1:随机从点集P中选取一个未访问的点,作为中心点,记为点Pc;
基于设置的距离度量方式,查找距当前中心点Pc的距离在预设距离阈值dth之内的所有点,记为集合M,并将集合M中各点的聚类标记为c;
所述距离度量方式为:D(a,b)=1-IOU(a,b),其中,D(a,b)表示真实框a,b之间的距离度量值,IOU(a,b)表示真实框a,b之间的交并比;
103-2:计算从中心点Pc到集合M中的每个点之间的向量,并对计算出来的所有向量进行累加,得到向量vector;
103-3:更新中心点Pc:将中心点Pc沿着从坐标原点到中心点Pc的方向移动,移动的距离为:||vector||;
103-4:基于更新后的中心点Pc,重复执行步骤103-2至103-3,直到||vector||小于预设的阈值,记录当前中心点Pc;
103-5:计算簇类c与当前已存在簇类c′的中心点之间的欧式距离,若该欧式距离小于阈值,则将簇类c与c′合并,合并后的簇类记为c′,并从合并的两个簇类的中心点中随机选取一个作为合并后的簇类的中心点;或取两个中心点之间的中点作为合并后的簇类的中心点;
若簇类c与当前已存在簇类c′的中心点之间的欧式距离大于或等于阈值,则将簇类c作为新的聚类;
103-6:重复步骤103-1至103-5,直到点集P的所有点均被标记访问;
104:基于步骤103得到的簇类数确定锚框的数量,并基于每个簇类的中心点的位置坐标所对应的长和宽确定锚框尺寸。
2.一种基于深度学习的轻量级目标检测方法,其特征在于,包括下列步骤:
步骤S1、构建轻量级目标检测模型:
所述轻量级目标检测模型从输入到输出依次包括:卷积层conv1、池化层pool1、第一分离卷积块、L个基础骨架网络和L+1个输出层;
其中,基础骨架网络之间通过一个卷积层连接;
第一个基础骨架网络的输入与第一分离卷积块相连;其中,分离卷积块包括三层分离卷积;分离卷积包括1×3的和3×1卷积核,用于对输入数据先进行卷积核为3×1的卷积运算,再进行卷积核为1×3的卷积运算;
且每个基础骨架网络的骨架第二卷积层输出的特征图依次经过卷积层、卷积核为1×1的卷积层,再输入输出层,得到一路输出支路,从而得到L路输出支路;
最后一个基础骨架网络的输出特征图依次经过卷积层、卷积核为1×1的卷积层,再输入输出层,得到第L+1路输出支路;
所述基础骨架网络包括:分离卷积块、骨架第一卷积层、分离卷积、骨架第二卷积层、骨架第三卷积层和和融合层;分离卷积块的第二层分离卷积与骨架第三卷积层输出的特征图在融合层进行维度拼接,得到每个基础骨架网络输出的特征图;
步骤S2、对轻量级目标检测模型进行模型训练:
设置训练样本集,并将训练样本输入轻量级目标检测模型,通过前向传播得到不同尺度的特征图,并输入对应的输出层中;
每个输出层中,将输入的特征图分成υ×υ个特征图格子;根据权利要求1所述的锚框生成方法,在每一个特征图格子中生成多个不同长宽的锚框,即候选框;基于输出层设置的激活函数,得到每个格子转换后的图像信息;再基于候选框进行目标检测处理,确定目标的预测框,并基于预测框的图像特征确定类别置信度得分;
模型训练时,损失函数包括分类损失函数和定位损失函数;
步骤S3、基于步骤3训练好的轻量级目标检测模型,对待检测图像进行目标检测处理:
将待检测图像输入到训练好的轻量级目标检测模型中,通过基础骨架网络中的多次卷积运算,得到不同尺度的特征图,并输入对应的输出层中进行目标检测处理,输出目标位置和类别得分信息,从而得到待检测图像的目标检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010889934.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序