[发明专利]一种适于隧道视角受限的目标深度学习视频检测方法在审

专利信息
申请号: 202110332618.8 申请日: 2021-03-29
公开(公告)号: CN115131742A 公开(公告)日: 2022-09-30
发明(设计)人: 阮雅端;王麟皇;孟凡泽;王翔;汪婧文;陈启美 申请(专利权)人: 南京大学
主分类号: G06V20/54 分类号: G06V20/54;G06V20/52;G06V10/32;G06V10/44;G06V10/762;G06V10/764;G06V10/82;G06T3/40;G06N3/04;G06N3/08
代理公司: 南京天翼专利代理有限责任公司 32112 代理人: 奚铭
地址: 210023 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适于 隧道 视角 受限 目标 深度 学习 视频 检测 方法
【权利要求书】:

1.一种适于隧道视角受限的目标深度学习视频检测方法,其特征是包括以下步骤:

step1:构建训练数据集:采集隧道内高清摄像头的视频图像,构建带有标注和标签的图片库作为网络模型的训练样本集,标注及标签即目标的目标框;

step2:构建网络模型:以SSD网络为基础构建检测网络,使用融入Mish激活函数和BN层的VGG-16作为检测网络的backbone,使用跃层双向多尺寸特征融合作为检测网络的neck,检测网络的head使用SSD网络的head;

step3:利用step1中的训练集训练step2中的网络模型,训练过程中采用基于目标尺寸大小的自适应在线难分样本发掘,训练获得检测模型;

step4:输入测试样本,通过训练好的检测模型预测出隧道图像中的目标位置及类别。

2.根据权利要求1所述的一种适于隧道视角受限的目标深度学习视频检测方法,其特征是步骤step2具体为:

step2.1:VGG-16中的激活函数配置为Mish函数,并在激活函数与卷积层之间插入BN层;

step2.2:在VGG-16网络后加入5层卷积层,分别得到大小为19*19、10*10、5*5、3*3、1*1的5层特征图;

step2.3:将step2.2中的5层特征图与VGG-16网络的最后一层特征图一起按照尺寸从小到大分别编号为1,2,3,4,5,6;

step2.4:将编号为1的特征图上采样,得到与编号为3的特征图一样大小的上采样图,将上采样图与编号为3的特征图融合,同理,将编号为3的特征图与编号为5的特征图融合,将编号为5的特征图与编号为6的特征图融合;

step2.5:将编号为6的特征图下采样,得到与编号为4的特征图一样大小的下采样图,将下采样图与编号为4的特征图融合,同理,将编号为4的特征图与编号为2的特征图融合,将编号为2的特征图与编号为1的特征图融合;

step2.6:融合过后的6层特征图构成6个尺寸大小不同的预测特征图,组成跃层双向特征融合网络,作为检测网络的neck;

step2.7:使用SSD网络的head作为检测网络的head。

3.根据权利要求1所述的一种适于隧道视角受限的目标深度学习视频检测方法,其特征是step3的难分样本发掘具体为:

step3.1:对训练样本集目标框的宽、高进行K-means聚类,根据聚类结果修改检测网络模型中预选框anchor的尺寸大小;

step3.2:用数据集扩充方法对训练集做数据扩充,数据集扩充方法包括旋转、颜色变换、平移叠加、以及将4张图片分别缩小至四分之一后再拼凑成一整张图片;

step3.3:基于目标尺寸大小的自适应在线难分样本发掘:将扩充后的训练集分batch,对每个batch中所有训练样本求其所有目标框的面积平均值每个预选框的面积Si除以得到损失放缩比例Ri,每个预选框的损失除以Ri后得到消除目标框面积影响的放缩损失,将所有预选框分为正负样本,分别按照放缩损失从大到小排序,得到正样本数量为m个,对所有正样本的损失计算反向传播,并取排序的前3*m个负样本计算反向传播,再将所有面积大于的负样本记为“大目标”组,剩下的负样本为“小目标”组,每组按照放缩损失排序,各取前m个负样本,共2m个负样本作为难分样本,用于下一个batch继续训练。。

4.根据权利要求1-3任一项所述的一种适于隧道视角受限的目标深度学习视频检测方法,其特征是在Step3的训练中,采用基于目标尺寸的损失函数SIoU:

其中IoU为预选框和目标框的交并比,x、y、w、h分别为预选框的横坐标、纵坐标、宽、高,xbt、ybt、wbt、hbt分别为预选框的横坐标、纵坐标、宽、高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110332618.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top