[发明专利]图像识别模型的训练方法、装置、计算机设备及存储介质在审
申请号: | 202211633167.2 | 申请日: | 2022-12-19 |
公开(公告)号: | CN116188839A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 白亚龙;张炜;姚霆;梅涛 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/20;G06V10/74;G06V10/82 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
1.一种图像识别模型的训练方法,其特征在于,包括:
获取初始图像;
基于第一类增强方法处理所述初始图像,得到第一标准视图;
基于第二类增强方法处理所述第一标准视图,得到风险视图,其中,所述第一类增强方法和所述第二类增强方法不相同;
根据所述第一标准视图和所述风险视图,生成有向视图对;
根据所述有向视图对训练初始图像识别模型,得到目标图像识别模型,其中,所述目标图像识别模型用于识别所述初始图像的目标视觉特征。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一标准视图和所述风险视图,生成有向视图对,包括:
获取与所述初始图像对应的初始视图集合,其中,所述初始视图集合包括:多个候选标准视图,其中,所述候选标准视图,由所述第一类增强方法处理所述初始图像得到;
从所述初始视图集合中采样与所述第一标准视图所匹配第一候选标准视图,其中,所述第一标准视图和所述第一候选标准视图构成第一有向视图对;
从所述初始视图集合中采样与所述风险视图所匹配第二候选标准视图,其中,所述风险视图和所述第二候选标准视图构成第二有向视图对;
将所述第一有向视图对和所述第二有向视图对共同作为所述有向视图对。
3.如权利要求2所述的方法,其特征在于,所述根据所述有向视图对训练初始图像识别模型,得到目标图像识别模型,包括:
根据所述第一有向视图对,生成标注视觉特征;
将所述第一有向视图对和所述第二有向视图对输入至所述初始图像识别模型之中,以得到所述初始图像识别模型输出的预测视觉特征;
如果所述标注视觉特征和所述预测视觉特征满足收敛条件,则将训练得到的图像识别模型作为所述目标图像识别模型。
4.如权利要求3所述的方法,其特征在于,所述根据所述第一有向视图对,生成标注视觉特征,包括:
生成所述第一标准视图的第一标注特征向量;
生成所述第一候选标准视图的第二标注特征向量;
将所述第一标注特征向量和所述第二标注特征向量共同作为所述标注视觉特征。
5.如权利要求4所述的方法,其特征在于,所述初始图像识别模型包括:编码与映射模块,所述方法还包括:
将所述第一标准视图输入至所述编码与映射模块中,得到所述编码与映射模块输出的第一预测特征向量;
将所述第一候选标准视图输入至所述编码与映射模块中,得到所述编码与映射模块输出的第二预测特征向量;
将所述风险视图输入至所述编码与映射模块中,得到所述编码与映射模块输出的第三预测特征向量;
将所述第二候选标准视图输入至所述编码与映射模块中,得到所述编码与映射模块输出的第四预测特征向量;
其中,所述第一预测特征向量、所述第二预测特征向量、所述第三预测特征向量,以及所述第四预测特征向量用于确定预测损失值,所述预测损失值用于确定满足所述收敛条件。
6.如权利要求5所述的方法,其特征在于,还包括:
确定所述第一标注特征向量和所述第三预测特征向量之间的第一相似度信息;
确定所述第二标注特征向量和所述第四预测特征向量之间的第二相似度信息;
确定所述第二标注特征向量和所述第一预测特征向量之间的第三相似度信息;
确定所述第一标注特征向量和所述第二预测特征向量之间的第四相似度信息;
根据所述第一相似度信息、所述第二相似度信息、所述第三相似度信息,以及所述第四相似度信息确定预测损失值。
7.如权利要求5所述的方法,其特征在于,还包括:
如果所述预测损失值小于目标损失值,则确定所述标注视觉特征和所述预测视觉特征满足所述收敛条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211633167.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无船承运业务规范化识别的方法
- 下一篇:一种浮阀塔盘及萃取塔
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序