[发明专利]一种图像表示学习方法及系统在审
申请号: | 202011632703.8 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112634174A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 胡郡郡 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/181;G06N3/04;G06N3/08 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 李红岩 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 表示 学习方法 系统 | ||
本申请公开了一种图像表示学习方法及系统。图像表示学习方法包括:增强图像获取步骤:获取原始图像的增强图像;特征映射获取步骤:通过编码器获取所述增强图像的特征映射;预测步骤:使用框回归网络预测所述增强图像的边框,并获取预测边框;计算步骤:计算真实边框与所述预测边框的最终损失,根据所述最终损失更新所述框回归网络及所述编码器。本发明提出一种图像表示学习方法及系统,本发明通过使用框回归的训练方法,提高了模型的表达能力,使模型获取更多的位置信息。对原始图片使用了两种增强方式,增强了模型的鲁棒性,能够更好的抑制噪声的同时,提高了对检测、分割任务的准确率。
技术领域
本申请涉及图像表示技术领域,尤其涉及一种图像表示学习方法及系统。
背景技术
深度学习在优化特定任务时,无论是分类,检测,还是分割,一般会先加载在imagenet上分类的预训练模型,然后迁移到下游任务中去,但是这种训练模式模糊了位置信息。除了在imagenet上分类的预训练模型,目前无监督的方法也被广泛研究,通过对比学习的方法来提升预训练模型的表达能力。本文提出另外一种提升表达能力的方法,在imagenet数据集上使用框回归的方法来学习表达能力,分类任务模糊了位置信息,框回归可以学习到更多的位置信息,有利于下游的对于位置信息较为敏感的任务。
因此,针对以上现状,本发明提出一种图像表示学习方法及系统,本发明通过使用框回归而不是分类的训练方法,提高了模型的表达能力,特别是提高了模型对位置、细节的敏感度,使模型获取更多的位置信息。对原始图片使用了两种增强方式,分别回归框,损失函数为两者叠加,增强了模型的鲁棒性,能够更好的抑制噪声的同时,提高了对检测、分割任务的准确率。
发明内容
本申请实施例提供了一种图像表示学习方法及系统,以至少解决相关技术中主观因素影响的问题。
本发明提供了一种图像表示学习方法,包括:
增强图像获取步骤:获取原始图像的增强图像;
特征映射获取步骤:通过编码器获取所述增强图像的特征映射;
预测步骤:使用框回归网络预测所述增强图像的边框,并获取预测边框;
计算步骤:计算真实边框与所述预测边框的最终损失,根据所述最终损失更新所述框回归网络及所述编码器。
上述的图像表示学习方法,所述增强图像获取步骤包括,对于每个所述原始图像,使用数据增强的方法,获取所述原始图像的至少两个所述增强图像。
上述的图像表示学习方法,所述特征映射获取步骤包括,使用深度学习特征,提取主干网络和多层感知器共同组成的所述编码器,并根据所述编码器获取所述特征映射。
上述的图像表示学习方法,所述预测步骤包括,使用所述框回归网络预测每一个所述增强图像的所述边框,并获取所述预测边框。
上述的图像表示学习方法,所述计算步骤包括,使用交并比损失分别计算所述原始图像的所述真实边框与每一个所述增强图像的所述预测边框的所述损失,将至少两个所述损失相加后获得最终损失,根据所述最终损失反向传播更新所述编码器与所述框回归网络。
本发明提供图像表示学习系统,其特征在于,适用于上述所述的图像表示学习方法,所述图像表示学习系统包括:
增强图像获取单元:获取原始图像的增强图像;
特征映射获取单元:通过编码器获取所述增强图像的特征映射;
预测单元:使用框回归网络预测所述增强图像的边框,获取预测边框;
计算单元:计算真实边框与所述预测边框的最终损失,根据所述最终损失更新所述框回归网络及所述编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011632703.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:取栓装置
- 下一篇:一种保水缓释肥料及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序