[发明专利]一种基于深度学习的长尾目标检测方法在审
申请号: | 202211677431.2 | 申请日: | 2022-12-26 |
公开(公告)号: | CN116129215A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 陶莹 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06V10/77;G06N3/0464 |
代理公司: | 北京精翰专利代理有限公司 11921 | 代理人: | 张丹 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 长尾 目标 检测 方法 | ||
1.一种基于深度学习的长尾目标检测方法,其特征在于,包括以下步骤:
S1、获取图像数据集:获取符合长尾分布的图像数据集,对数据集进行划分,划分训练集和测试集;
S2、数据集预处理:对数据集进行预处理,计算每个类别的有效样本数;
S3、输出logit:采用预训练模型在训练集上训练,得到训练网络输出的logit;
S4、筛选语义相似类别:对网络输出logit进行阈值设置,只对与头部类语义相似的尾部类进行抑制;
S5、权重设置:根据有效样本数的倒数进行权重设置;
S6、目标模型测试:权重设置后得到最终目标检测模型,将最终检测模型在测试集上测试得到测试结果。
2.根据权利要求1所述的一种基于深度学习的长尾目标检测方法,其特征在于:数据集为LVIS数据集。
3.根据权利要求1所述的一种基于深度学习的长尾目标检测方法,其特征在于:所述S2中,计算类别的有效样本数,获得每个类别实际有效的样本数量,使用公式为:
En=(1-βn)/(1-β),β=(N-1)/N;
其中,样本数据集为S,有效样本数量为N,En表示第n次采样的期望值,n为样本数量,当N超过相对阈值时,样本的有效数量与样本的数量n相同,以此减少数据重叠,使得每个样本都是唯一的。
4.根据权利要求1所述的一种基于深度学习的长尾目标检测方法,其特征在于:所述S3中,图像通过骨干网络生成特征图,在特征图上生成感兴趣的区域,为每个区域都提取一个特征,最后对网络的输出进行处理,得出每个类别的分布,计算估计分布和真实框分布之间的交叉熵;
交叉熵为Sigmoid交叉熵函数,使用Sigmoid交叉熵函数对全连接层输出的逻辑值Zi进行计算,Zi为网络输出的类别i逻辑值,通过Sigmoid交叉熵函数独立的估计每个类别的概率pi映射到(0,1)之间,得到当前样本k属于类别i概率,公式如下:
类别真实的标签y是二分类,当候选区域是背景类或者不属于类别i时yk=0,当候选区域属于类别i时yk=0,交叉熵损失公式如下:
根据交叉熵损失公式得到对全连接层输出的逻辑值Zi的梯度,对于尾部类别i≠k,交叉熵损失函数产生负抑制梯度,迫使分类器i输出低置信度;
从sigmoid交叉熵损失函数相对于网络输出的逻辑值zi的梯度公式得出,当不考虑长尾的类别分布,对于尾部类别i≠k不属于k类别的,生成负抑制梯度以迫使分类器输出低置信度。
5.根据权利要求1所述的一种基于深度学习的长尾目标检测方法,其特征在于:所述S4中网络输出的logit值与设置的阈值进行比较,当logit值大于设置阈值时对当前类进行抑制,当logit值小于阈值时不对当前类产生抑制,从而接收到网络的负抑制梯度变小,提高尾部类的精度。
6.根据权利要求1所述的一种基于深度学习的长尾目标检测方法,其特征在于:所述S5选中所述S4中要进行抑制的类别,根据类别的有效样本数计算每个类别应该受到的抑制程度,也就是各自有效样本数的倒数,具体计算公式为:
其中,ξ为阈值超参数,β为有效样本的超参数,wi为总体的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211677431.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冗余型机械手自主自适应轨迹规划方法
- 下一篇:一种高光胶印印刷光油