[发明专利]一种针对工业场景基于改进YOLOv4的小目标检测方法在审

申请号：	202110508078.4	申请日：	2021-05-11
公开（公告）号：	CN113128465A	公开（公告）日：	2021-07-16
发明（设计）人：	李忠涛;袁朕鑫;赵帅;赵富;孙豪坤;菅国栋;李帅;姜琳琳;肖鑫;程衍泽;张玉璘;赵秀阳;孔祥玉;郭庆北;王凯	申请（专利权）人：	济南大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	山东国诚精信专利代理事务所(特殊普通合伙) 37312	代理人：	吴佳佳
地址：	250000 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种针对工业场景基于改进 yolov4 目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种针对工业场景基于改进YOLOv4的小目标检测方法，其特征在于，包括以下步骤：

S1、通过工业摄像头采集现场数据集，采集的数据集包括在不同的天气环境光线下，丰富数据集的多样性；

S2、对采集的数据集进行标注，划分训练集和测试集，并对采集的数据集进行数据增强；

S3、通过K-Means++聚类算法，对数据集中真实目标框计算出针对本数据集的不同大小的先验框大小；

S4、对YOLOv4模型中的网络进行修改，去除其中一个的检测头，得到YOLOv4-head2网络模型；

S5、将训练集输入YOLOv4-head2模型训练，并使用验证集不断优化模型效果；

S6、在YOLOv4的特征融合层，添加与低特征层的特征融合，加强特征融合，降低随层数的增加造成的特征损失，得到YOLOv4-head2-L网络结构；

S7、将评价较高的模型经过转换，采用TensorRT技术进行前向推理以达到提高检测速度和部署小型边缘计算设备的目标。

2.根据权利要求1所述的一种针对工业场景基于改进YOLOv4的小目标检测方法，其特征在于：步骤S4中所述对模型网络进行修改，去除其中一个检测头，得到YOLOv4-L网络模型如下：

S41：根据工业生产线上目标检测的特点，图像采集摄像头的位置一般是固定的，采集的图像大小尺寸是固定的，且被识别的目标大小是在一定尺度范围内变化；

S42：YOLOv4模型中设有三个尺度的检测头，分别用于检测不同尺度大小的目标；

S43：实际目标尺度大小都是均匀尺寸的物体，因此会出现在检测时，不同尺寸的预测和分类得不到很好的训练而使得网络使用不完全；

S44：可根据实际输入图像中目标尺寸的范围，修改YOLOv4模型的检测头数量，去除冗余的检测尺度，即与预测和分类目标尺度相差较大的一支，降低模型的计算压力，降低计算量和参数量，充分利用网络结构，加快模型的检测速度；

S45：根据S3中聚类后的目标框的宽w_i和高h_i，S₁、S₂、S₃分别是YOLOV4的三个特征层的检测尺度(S_wi为第i个检测尺度的宽，S_hi为第i个检测尺度的高)。

S₁＞S₂＞S₃，S_i＝S_wi·S_hi

S46：计算可推聚类出数据集中目标框的平均面积area_avg

area_avg∈(S_w1·S_h1,S_w2·S_h2)

S47：由此根据S46中聚类结果的尺寸范围，对S₁、S₂、S₃不同尺度的检测头进行调整，以优化网络，防止计算资源浪费，提高模型的检测速度。

3.根据权利要求1所述的一种针对工业场景基于改进YOLOv4的小目标检测方法，其特征在于：步骤S6中所述在YOLOv4的特征融合层，添加与低特征层的特征融合特征如下：

S61：融合不同层特征有助于提高分割性能，低层特征分辨率更高，含有更多位置和细节信息，高层特征具有更强的语义信息，分辨率较低，对细节的感知能力不强，因此低层与高层的特征融合，有助于改善模型的性能；

S62：YOLOv4网络结构中基于PANet进行实例分割，使其能够准确地保存空间信息，有助于正确定位像素点。在FPN的基础上，增加自底向上的路径增强，对不同层进行拼接，以提高预测的准确性；

S63：参考BiFPN结构，在PANet的基础上，增加低层和高层的跨层连接，与NAS-FPN相比更加轻量和简洁高效，同时更好的进行融合低层定位信息和高层的强语义信息。

4.根据权利要求1所述的一种针对工业场景基于改进YOLOv4的小目标检测方法，其特征在于：步骤S7中将评价较高的模型进过转换，使用TensorRT前向推理的过程如下：

S71:经过步骤S6得到评价较高的模型，设置batch_size和subdivisions的值为1，设置精度为INT8，将weights格式的权重文件转换为onnx格式的模型；构造推理引擎，将onnx格式权重文件转换为engine格式权重文件，engine格式权重用于模型的前向推理。

S72：将网络模型进行裁剪，对网络结构进行垂直整合，即conv、BN、Relu融合为一层；水平整合，即将输入为相同的张量和执行相同操作的融合在一起；减少concat层，将contact的输入直接送至下一步操作中，减少数据的传输吞吐。

S73：小型边缘设备部署，受限于小型设备的计算能力和内存空间有限，同时权重文件的加载速度影响着程序运行的速度，将推理引擎加载后的对象进行序列化，序列化后存至存储设备中，下次需要加载推理引擎时，只需要提取存储设备中对象反序列化后即可进行推理计算。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于济南大学，未经济南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110508078.4/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载