[发明专利]神经网络模型的训练方法、图像特征提取方法及相关装置在审
申请号: | 202110970481.9 | 申请日: | 2021-08-23 |
公开(公告)号: | CN113657411A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 朱文涛;尚航;吕廷迅;杨森;刘霁 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王英 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 图像 特征 提取 相关 装置 | ||
本申请提供一种神经网络模型的训练方法、图像特征提取方法及相关装置,用于解决相关技术中自监督学习对硬件要求高且训练速度低的问题。在本申请实施例提供的对比学习方法中,提出了困难负样本对的概念,通过构建正样本对和困难负样本对,能够使得神经网络模型学习到正样本之间的特征,而且能够准确的区分差别较小的负样本。由此,保证了对困难负样本的学习,即保证了对差别较大的负样本的学习,使得神经网络模型能够准确的提取图像特征。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种神经网络模型的训练方法、图像特征提取方法及相关装置。
背景技术
随着图像、视频资源的不断增多,为了便于对不同的多媒体资源进行管理、查询,往往需要获得多媒体资源的一些特征。利用特征之间的相似度能够找到相似的资源,利用多媒体资源的特征也能够实现多媒体资源推荐。
相关技术中,面对海量的多媒体资源,通常采用神经网络模型提取多媒体资源的特征。神经网络模型从大规模无标注的数据集中学习,在计算机视觉中,一直是个很热的方向。
自监督学习方式中每个单独的任务都需要花费大量精力,时间成本等来获取大规模的高质量的标签。而在各种数据中心和数据源中,非标注的数据是海量的,这些非标注数据可采用非监督学习或者自监督学习从海量的非标注数据中高效地学习任务无关的特征表示。
然而,现有的主流自监督学习方式的学习效率有待提高。
发明内容
本申请实施例提供一种神经网络模型的训练方法、图像特征提取方法及相关装置,用于解决相关技术中用于提取图像特征的神经网络采用自监督学习方式需要提高学习效率的问题。
第一方面,本申请提供一种基于对比学习的神经网络模型训练方法,所述神经网络模型用于提取图像特征,所述方法包括:
提取正样本对和困难负样本对,其中,正样本对包括第一图像和第二图像,所述第二图像为对所述第一图像经过数据扩增处理之后得到的,困难负样本对包括第三图像和第四图像,且所述第三图像和所述第四图像之间的差异度小于指定差异度;
基于所述正样本对和所述困难负样本对,采用对比学习方法训练所述神经网络模型。
可选的,基于所述正样本对和所述困难负样本对,采用对比学习方法训练所述神经网络模型,包括:
将所述正样本对和所述困难负样本对分别输入所述神经网络模型,得到所述神经网络模型提取的所述第一图像、所述第二图像、所述第三图像和所述第四图像各自的图像特征;
基于所述第一图像的图像特征和所述第二图像的图像特征,确定所述第一图像和所述第二图像之间的差异度作为正样本损失,并基于所述第三图像的图像特征和所述第四图像的图像特征,确定所述第三图像和所述第四图像之间的差异度作为负样本损失;
基于所述正样本损失和所述负样本损失,确定所述神经网络模型的总损失;
基于所述神经网络模型的总损失,更新所述神经网络模型的模型参数。
可选的,同一训练批次包括多个正样本对和多个困难负样本对,所述基于所述正样本损失和所述负样本损失,确定所述神经网络模型的总损失,包括:
获取所述同一训练批次中正样本对的正样本损失,以及所述同一训练批次中困难负样本对的负样本损失;
基于同一训练批次中正样本对的正样本损失确定正样本总损失,基于同一训练批次中困难负样本对的负样本损失确定负样本总损失;
将所述正样本总损失和所述负样本总损失进行加权求和,得到所述神经网络模型的总损失,其中,正样本总损失的权重为正数,负样本总损失的权重为负数。
可选的,所述基于同一训练批次中正样本对的正样本损失确定正样本总损失,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110970481.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:穿刺刀头、穿刺装置以及活检系统
- 下一篇:一种自适应阈值的细胞图像分割方法