[发明专利]一种基于深度学习的长尾目标检测方法在审
申请号: | 202211677431.2 | 申请日: | 2022-12-26 |
公开(公告)号: | CN116129215A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 陶莹 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06V10/77;G06N3/0464 |
代理公司: | 北京精翰专利代理有限公司 11921 | 代理人: | 张丹 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 长尾 目标 检测 方法 | ||
本发明公开了一种基于深度学习的长尾目标检测方法,包括以下步骤:S1、获取图像数据集:获取符合长尾分布的图像数据集,对数据集进行划分,划分训练集和测试集;S2、数据集预处理:对数据集进行预处理,计算每个类别的有效样本数;S3、输出logit:采用预训练模型在训练集上训练,得到训练网络输出的logit;S4、筛选语义相似类别:对网络输出logit进行阈值设置,只对与头部类语义相似的尾部类进行抑制,提高网络对尾部类别的关注程度;接着根据网络输出的logit自适应地调整语义相似类别间的抑制梯度,增强对尾部类别的区分,在类别间数据量存在显著差别的长尾数据集LVIS上进行实验,提高尾部类别的检测精度。
技术领域
本发明涉及机器学习技术领域,具体为一种基于深度学习的长尾目标检测方法。
背景技术
现实世界中大规模数据集的快速增长,使得基于深度学习的方法解决长尾数据分布的目标检测问题是一项具有挑战性的任务。深长尾学习是视觉识别中最具挑战性的问题之一,旨在从大量遵循长尾类分布的图像中训练性能良好的深模型。长尾数据分布即少数头部几个类占了大部分数据,而大多数尾部类却没有得到充分代表。针对长尾数据集在尾部类别预测不准确、检测精度低、训练得到的模型缺乏对具有相似语义的头部类和尾部类的判别力等问题,主流的长尾解决方法不同程度的减少了对尾部类的抑制,但是在这些方法中,忽略了任何数据集中都存在着语义相似的类别。尤其是当尾部类中存在与头部类语义相似的类别时,为了减少对尾部类的抑制后,忽略了头部类产生的负梯度,网络很难学习到有判别力的特征,为此,需要一种基于深度学习的长尾目标检测方法。
发明内容
本发明的目的在于提供一种基于深度学习的长尾目标检测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习的长尾目标检测方法,包括以下步骤:
S1、获取图像数据集:获取符合长尾分布的图像数据集,对数据集进行划分,划分训练集和测试集;
S2、数据集预处理:对数据集进行预处理,计算每个类别的有效样本数;
S3、输出logit:采用预训练模型在训练集上训练,得到训练网络输出的logit;
S4、筛选语义相似类别:对网络输出logit进行阈值设置,只对与头部类语义相似的尾部类进行抑制;
S5、权重设置:根据有效样本数的倒数进行权重设置;
S6、目标模型测试:权重设置后得到最终目标检测模型,将最终检测模型在测试集上测试得到测试结果。
优选的,数据集为LVIS数据集。
优选的,所述S2中,计算类别的有效样本数获得每个数据类实际可用的有效样本数量,使用公式为:
En=(1-βn)/(1-β),β=(N-1)/N;
其中,样本数据集为S,有效样本数量为N,En表示第n次采样的期望值,n为样本数量,当N超过相对阈值时,样本的有效数量与样本的数量n相同,以此减少数据重叠,使得每个样本都是唯一的。
优选的,所述S3中,图像通过骨干网络生成特征图,在特征图上生成感兴趣的区域,为每个区域都提取一个特征,最后对网络的输出进行处理,得出每个类别的分布,计算估计分布和真实框分布之间的交叉熵;
交叉熵为Sigmoid交叉熵函数,使用Sigmoid交叉熵函数对全连接层输出的逻辑值Zi进行计算,Zi为网络输出的类别i逻辑值,通过Sigmoid交叉熵函数独立的估计每个类别的概率pi映射到(0,1)之间,得到当前样本k属于类别i概率,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211677431.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冗余型机械手自主自适应轨迹规划方法
- 下一篇:一种高光胶印印刷光油