[发明专利]模型训练方法、图像特征提取方法、目标检测方法和装置在审
申请号: | 202011035233.7 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112232384A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 王远江;郑凯;袁野 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王婷婷 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 图像 特征 提取 目标 检测 装置 | ||
1.一种图像特征提取模型训练方法,其特征在于,所述方法包括:
获取第一样本集,所述第一样本集中包括样本图像;
从所述第一样本集中提取部分样本图像作为目标样本图像,执行如下训练步骤:将各目标样本图像输入至初始模型,得到各目标样本图像的特征信息;对所得到的特征信息进行聚类,并基于聚类结果确定各目标样本图像对应的负样本图像;确定各目标样本图像对应的正样本图像;基于各目标样本图像对应的正样本图像和负样本图像,确定损失值,并基于所述损失值调整所述初始模型的参数;响应于检测到所述初始模型训练完成,将调整参数后的初始模型确定为图像特征提取模型。
2.根据权利要求1所述的方法,其特征在于,所述获取第一样本集,包括:
获取未标注的第二样本集,所述第二样本集中包括原始样本图像;
对所述原始样本图像执行以下至少一项操作,得到所述原始样本图像对应的增强样本图像:随机裁剪、水平翻转、色度调整、亮度调整、饱和度调整、高斯噪声添加;
将所述第二样本集中的原始样本图像和所得到的增强样本图像进行汇总,得到第一样本集。
3.根据权利要求1-2之一所述的方法,其特征在于,所述第一样本集中的样本图像包括原始样本图像和所述原始样本图像对应的增强样本图像;以及,所述基于聚类结果确定各目标样本图像对应的负样本图像,包括:
基于聚类结果为各目标样本图像设置聚类标签,其中,特征信息属于同一聚类的目标样本图像具有相同的聚类标签,特征信息不属于同一聚类的目标样本图像具有不同的聚类标签;
将与该目标样本图像具有不同的聚类标签的各样本图像作为该目标样本图像对应的负样本图像。
4.根据权利要求2或3之一所述的方法,其特征在于,所述确定各目标样本图像对应的正样本图像,包括:
对于每一个目标样本图像,从与该目标样本图像具有相同的聚类标签的其余样本图像中,选取该目标样本图像对应的增强样本图像和/或原始样本图像,作为该目标样本图像对应的正样本图像;
或者,对于每一个目标样本图像,选取该目标样本图像对应的增强样本图像和/或原始样本图像,作为该目标样本图像对应的正样本图像。
5.根据权利要求1-4之一所述的方法,其特征在于,所述基于各目标样本图像对应的正样本图像和负样本图像,确定损失值,包括:
对于每一个目标样本图像,检测该目标样本图像的特征信息与该目标样本图像对应的各正样本图像的特征信息的第一距离之和,并检测该目标样本图像的特征信息与该目标样本图像对应的各负样本图像的特征信息的第二距离之和;将所述第一距离之和与所述第二距离之和的比值作为该目标样本图像对应的损失值;
将各目标样本图像对应的损失值求和,得到所述初始模型的损失值。
6.根据权利要求1-5之一所述的方法,其特征在于,所述对所得到的特征信息进行聚类,包括:
获取预设数量的聚类中心;
检测所得到的各特征信息到各聚类中心的距离;
对于所得到的每一个特征信息,将与该特征信息距离最小的聚类中心对应的聚类作为该特征信息所属的聚类。
7.根据权利要求6所述的方法,其特征在于,在所述对所得到的特征信息进行聚类之后,所述训练步骤还包括:
对于每一个聚类,逐一地从该聚类中选取一个特征信息作为目标特征信息,将该聚类的聚类中心与所述目标特征信息加权求和,得到加权求和结果,并将该聚类的聚类中心替换为所述加权求和结果。
8.根据权利要求1-7之一所述的方法,其特征在于,所述方法还包括:
响应于检测到所述初始模型未训练完成,重新从所述第一样本集中提取部分样本图像作为目标样本图像,并使用调整参数后的初始模型和新的目标样本图像,继续执行所述训练步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011035233.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序