[发明专利]一种基于改进的Mixed Pooling-YOLOV3目标检测方法有效
申请号: | 202010146020.5 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111353544B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 郝琨;郭飞;赵璐 | 申请(专利权)人: | 天津城建大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/80;G06N3/0464;G06N3/08 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 林艳艳 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 mixed pooling yolov3 目标 检测 方法 | ||
1.一种基于改进的Mixed Pooling-YOLOV3目标检测方法,其特征在于,该方法包括以下步骤:
a.制作非自然场景中的图像数据集,并对部分图像进行预处理操作;所述非自然场景中含有各种类型目标对象;
b.数据预处理完成之后根据需要识别的目标类型优化DMP网络参数并开始模型训练;
c.训练完模型之后将采集得到的图像输入到模型中进行测试,实现目标的识别与定位;
所述的模型训练和目标的识别与定位是基于Mixed Pooling-YOLOV3的DMP框架进行,其是先将输入的图像分成S×S等大的网络单元,目标的中心所在的网格单元负责检测这个目标;然后利用DMP特征提取网络对输入图像进行特征提取,得到一定尺寸大小的特征图,之后继续利用卷积网络进一步完成目标的检测与定位;采用GIoU来衡量检测边框和真实边框之间的差距,GIoU的值越大说明定位误差越小;因为每个格子中都会预测固定数量的边界框,要选择与真实目标置信度值最大的那个边框作为最终检测边框,最理想的情况是GIoU=IoU:找到所有真实边框的集合为GroundTruth(GT)与所有预测边框的集合为DectionResult(DR)的最小闭包最终计算得到GIoU值:
Mixed Pooling-YOLOV3在每一个单元格上为每个边界框预测4个值,记为(tx,ty,tw,th),如果目标网格偏离图像左上角的边距(cx,cy),且它对应锚点框的宽和高(pw,ph),那么最终的网格预测值为
bx=σ(tx)+cx (3) by=σ(ty)+cy (4)
其中,cx,cy是目标网格偏移图像的偏移量;pw,ph是对应锚点框的宽和高;bx,by,bw,bh为最终预测得到的边框坐标值;tx,ty,tw,th为DMP特征提取网络学习目标;x,y为目标对象的中心位置坐标;w,h为目标对象坐标相对于网格的偏移的宽度和高度;所述的x,y,w,h为了数据处理方便,均作归一化处理;
所述的DMP框架的0~79层中,共有52个卷积层,其中res层用于解决网络的梯度弥散或者是梯度爆炸的问题;Mixed Pooling层旨在通过降低特征映射的分辨率,同时解决过度拟合的问题;
所述的DMP框架的79~111层作为Mixed Pooling-YOLOV3特征交互层,所述的特征交互层分为三个尺寸,每个尺寸内,通过卷积核的方式实现局部的特征交互,通过卷积核1*1和3*3的方式实现特征映射图之间的局部特征交互;
所述的三个尺寸的特征输出尺寸具体如下:
尺寸1:在基础网络之后添加少数卷积层再输出boundingbox信息;
尺寸2:为了实现细粒度的检测,从尺寸1中倒数第二层的卷积层又开始作上采样再与最后一个26*26大小的特征图进行融合操作,同样经过几个卷积层后得到输入图像16倍下采样的特征图,再次输出boundingbox信息,相比尺寸1变为原来的2倍;
尺寸3:从尺寸2输出的特征图基础上再次进行上采样,最后得到相对输入图像8倍下采样的52*52特征图,在此基础上进行分类和回归。
2.如权利要求1所述的基于改进的Mixed Pooling-YOLOV3目标检测方法,其特征在于,所述的步骤a中,图像数据集的格式为VOC格式;图像数据集制作时,采集含有各种类型目标对象的图像,利用标签制作工具将所述图像数据集中各类型目标对象进行位置和类别标记,同时采用数据增强技术对部分图像进行翻转、裁剪、平移等一系列预处理操作,进而制得图像数据集。
3.如权利要求2所述的基于改进的Mixed Pooling-YOLOV3目标检测方法,其特征在于,所述标签制作工具为labelImg标签制作工具,所述图像数据集包括存储图像的文件、存放xml标签的文件以及存放图像路径的txt文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津城建大学,未经天津城建大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010146020.5/1.html,转载请声明来源钻瓜专利网。