[发明专利]模型训练方法、图像特征提取方法、目标检测方法和装置在审
申请号: | 202011035233.7 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112232384A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 王远江;郑凯;袁野 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王婷婷 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 图像 特征 提取 目标 检测 装置 | ||
本申请实施例公开了模型训练方法、图像特征提取方法、目标检测方法和装置。该方法的实施例包括:获取第一样本集,第一样本集中包括样本图像;从第一样本集中提取部分样本图像作为目标样本图像,执行如下训练步骤:将各目标样本图像输入至初始模型,得到各目标样本图像的特征信息;对所得到的特征信息进行聚类,并基于聚类结果确定各目标样本图像对应的负样本图像;确定各目标样本图像对应的正样本图像;基于各目标样本图像对应的正样本图像和负样本图像,确定损失值,并基于损失值调整初始模型的参数;响应于检测到初始模型训练完成,将调整参数后的初始模型确定为图像特征提取模型。该实施方式降低了模型训练时的人力成本,同时提高了模型的准确性。
技术领域
本申请实施例涉及计算机技术领域,具体涉及模型训练方法、图像特征提取方法、目标检测方法和装置。
背景技术
随着人工智能领域的发展,模型训练任务越来越多。例如,在图像特征提取模型、目标检测模型等模型训练时,通常需要使用大量的带有标注的样本,使模型进行充分的有监督学习。
现有技术中,通常通过人工为样本进行标注,从而使用带有标注的样本进行模型训练。这种人工标注方式较为耗费人力成本。同时,人工标注存在的主观差异性,会导致标注不够准确,从而导致模型的输出结果的不够准确。
发明内容
本申请实施例提出了模型训练方法、图像特征提取方法、目标检测方法和装置,以解决现有技术中在模型训练过程中因人工标注样本导致人力成本较高以及模型的输出结果的准确性较低的技术问题。
第一方面,本申请实施例提供了一种图像特征提取模型训练方法,该方法包括:获取第一样本集,所述第一样本集中包括样本图像;从所述第一样本集中提取部分样本图像作为目标样本图像,执行如下训练步骤:将各目标样本图像输入至初始模型,得到各目标样本图像的特征信息;对所得到的特征信息进行聚类,并基于聚类结果确定各目标样本图像对应的负样本图像;确定各目标样本图像对应的正样本图像;基于各目标样本图像对应的正样本图像和负样本图像,确定损失值,并基于所述损失值调整所述初始模型的参数;响应于检测到所述初始模型训练完成,将调整参数后的初始模型确定为图像特征提取模型。
第二方面,本申请实施例提供了一种图像特征提取方法,该方法包括:获取目标图像;将所述目标图像输入至采用第一方面中的方法训练得到的图像特征提取模型,得到所述目标图像的特征信息。
第三方面,本申请实施例提供了一种目标检测方法,包括:获取目标图像;将所述目标图像输入至预先训练的目标检测模型,得到所述目标图像的目标检测结果,其中,所述目标检测模型中包含图像特征提取模型,所述图像特征提取模型通过第一方面中的方法训练得到。
第四方面,本申请实施例提供了一种图像特征提取模型训练装置,该装置包括:获取单元,被配置成获取第一样本集,所述第一样本集中包括样本图像;第一训练单元,被配置成从所述第一样本集中提取部分样本图像作为目标样本图像,执行如下训练步骤:将各目标样本图像输入至初始模型,得到各目标样本图像的特征信息;对所得到的特征信息进行聚类,并基于聚类结果确定各目标样本图像对应的负样本图像;确定各目标样本图像对应的正样本图像;基于各目标样本图像对应的正样本图像和负样本图像,确定损失值,并基于所述损失值调整所述初始模型的参数;响应于检测到所述初始模型训练完成,将调整参数后的初始模型确定为图像特征提取模型。
第五方面,本申请实施例提供了一种图像特征提取装置,该装置包括:获取单元,被配置成获取目标图像;输入单元,被配置成将所述目标图像输入至采用第一方面中的方法训练得到的图像特征提取模型,得到所述目标图像的特征信息。
第六方面,本申请实施例提供了一种目标检测装置,该装置包括:获取单元,被配置成获取目标图像;输入单元,被配置成将所述目标图像输入至预先训练的目标检测模型,得到所述目标图像的目标检测结果,其中,所述目标检测模型中包含图像特征提取模型,所述图像特征提取模型通过第一方面中的方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011035233.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序