[发明专利]目标检测方法、系统及计算机设备在审
申请号: | 202210345786.5 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114648701A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李军 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06N3/04;G06N3/08 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 劳奕琴 |
地址: | 215168 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 系统 计算机 设备 | ||
本发明公开了一种目标检测方法、系统及计算机设备,方法包括:将第一输入图像输入第一编码器获取第一输出数据并将第二输入图像输入第二编码器获取第二输出数据;第一编码器为Query编码器,第二编码器为Key编码器;基于第一输出数据与第二输出数据计算第一损失与第二损失,第一损失为第一编码器与第二编码器的信息噪音对比估计损失,第二损失为第一编码器与第二编码器的融合对比学习损失;基于第一损失与第二损失生成联合损失函数;基于联合损失联合函数进行预训练获得目标检测模型;基于目标检测模型执行目标检测任务;基于Query与Key编码器构成的MoCo自监督学习框架,计算由InfoNCE损失与Mixco损失构成的联合损失函数预训练模型,有效提升目标检测任务的性能。
技术领域
本发明涉及目标检测领域,具体涉及一种目标检测方法、系统及计算机设备。
背景技术
大多数目标检测器如Faster RCNN、Mask RCNN都采用“预训练+微调”的方式。在预训练阶段,目标检测器需要依赖于如VOC、COCO数据集等大型的监督目标检测数据集,这些大型数据集当中的每个目标类别都有超过成百上千的注释示例,而目标检测任务需要进行密集的图像标记,这导致目标检测任务极为昂贵和耗时。
目前通常采用自监督算法避免上述标记带来的问题,自监督算法旨在从未标记的数据中进行视觉特征学习,然后将视觉特征表示迁移至下游的目标检测任务。对比学习是自监督学习主流的一种学习范式,具体指的是从给定的相似样本对或者不相似样本对学习到相似表示或者不相似表示,并利用对比学习框架进行表示对比学习。但最近一些研究表明,视觉表示在目标检测下游任务的性能并不是正相关,换句话而言,较高的ImageNetTop-1(图片检测准确率的标准)精度并不一定能够保证有较高的目标检测性能。造成上述现象的原因主要有两个,第一个原因是预训练使用的图像识别数据库Imagenet中大部分是单目标数据(iconic-object),单目标数据适合进行以对比学习的方式进行非监督模型学习,但目标检测这种下游任务使用的微调的数据集都是多目标图像集,并不适用于直接进行数据增强的对比学习;第二个原因是这种视觉表示特征应用全局池化层生成向量嵌入,容易破坏图像空间结构并丢失局部信息,导致不能完整保留原有的物体目标空间,而不能满足目标检测器对空间定位的敏感度需求。
当然,目前也出现了提升目标检测任务效果的方法,其一是针对目标检测任务提出了一种称为实例定位的自监督辅助任务,通过引入实例定位的这种辅助任务可以在进行实例可辨别性表示学习的同时,对图像中物体位置信息进行建模学习;其二是提出了融合对比学习Mixco(Mix-up Contrast Learning),对输入的样本进行融合(mix-up)操作,并将融合之后的样本称之为半正样本,原因是融合之前的样本互为负样本,然后进行对比学习,以提升对比学习的视觉表示能力。但实例定位的自监督辅助任务并不能增强视觉表示学习的泛化性,导致预训练的视觉表示在下游目标检测任务性能受限,而融合对比学习Mixco虽然能够学到更好的视觉表示特征,但是并没有考虑目标检测的特有结构特性,对于下游目标检测任务的性能提升十分有限。
综上所述,目前仍然需要一种目标检测方法,不需要数据标注的同时提升目标检测任务的性能。
发明内容
本发明目的是:提供一种目标检测方法、系统及计算机设备。
本发明的技术方案是:第一方面,本发明提供一种目标检测方法,所述方法包括:
将第一输入图像输入第一编码器获取第一输出数据并将第二输入图像输入第二编码器获取第二输出数据;所述第一编码器为Query编码器,所述第二编码器为Key编码器;
基于所述第一输出数据与所述第二输出数据计算第一损失与第二损失,所述第一损失为所述第一编码器与所述第二编码器的信息噪音对比估计损失,所述第二损失为所述第一编码器与所述第二编码器的融合对比学习损失;
基于所述第一损失与所述第二损失生成联合损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210345786.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效制冷系统及控制方法
- 下一篇:显示设备及基于人像的距离检测方法