[发明专利]一种图像识别模型的训练方法、图像识别的方法及装置有效
申请号: | 202110547585.9 | 申请日: | 2021-05-19 |
公开(公告)号: | CN112990390B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 郭卉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/58;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 模型 训练 方法 装置 | ||
1.一种图像识别模型的训练方法,其特征在于,包括:
获取待训练内容样本图像以及待训练风格样本图像,其中,所述待训练内容样本图像具有已标注的第一场景标签以及已标注的第一风格标签,所述待训练风格样本图像具有已标注的第二场景标签以及已标注的第二风格标签,所述第一风格标签与所述第二风格标签属于不同的风格标签类型;
根据所述待训练内容样本图像以及所述待训练风格样本图像,生成待训练模拟样本图像,其中,所述待训练模拟样本图像具有所述第一场景标签以及所述第二风格标签;
基于所述待训练模拟样本图像,通过待训练图像识别模型获取所述待训练模拟样本图像的第一预测场景标签以及第一预测风格标签;
基于所述待训练风格样本图像,通过所述待训练图像识别模型获取所述待训练风格样本图像的第二预测场景标签以及第二预测风格标签;
根据所述待训练模拟样本图像的所述第一场景标签、所述第一预测场景标签、所述待训练模拟样本图像的所述第二风格标签、所述第一预测风格标签、所述待训练风格样本图像的所述第二场景标签、所述第二预测场景标签、所述待训练风格样本图像的所述第二风格标签以及所述第二预测风格标签,对所述待训练图像识别模型的模型参数进行更新,直至满足模型训练条件,输出图像识别模型;
其中,所述根据所述待训练模拟样本图像的所述第一场景标签、所述第一预测场景标签、所述待训练模拟样本图像的所述第二风格标签、所述第一预测风格标签、所述待训练风格样本图像的所述第二场景标签、所述第二预测场景标签、所述待训练风格样本图像的所述第二风格标签以及所述第二预测风格标签,对所述待训练图像识别模型的模型参数进行更新,包括:
根据所述待训练模拟样本图像的所述第一场景标签以及所述第一预测场景标签,确定第一场景损失值;
根据所述待训练模拟样本图像的所述第二风格标签以及所述第一预测风格标签,确定第一风格损失值;
根据所述待训练风格样本图像的所述第二场景标签以及所述第二预测场景标签,确定第二场景损失值;
根据所述待训练风格样本图像的所述第二风格标签以及所述第二预测风格标签,确定第二风格损失值;
对所述第一场景损失值、所述第一风格损失值、所述第二场景损失值以及所述第二风格损失值进行求和,得到目标损失值;
采用所述目标损失值对所述待训练图像识别模型的模型参数进行更新。
2.根据权利要求1所述的训练方法,其特征在于,所述获取待训练内容样本图像以及待训练风格样本图像,包括:
获取内容样本图像集合,其中,所述内容样本图像集合包括M个内容样本图像,所述M为大于1的整数;
将所述内容样本图像集合中的一个内容样本图像作为所述待训练内容样本图像;
获取风格样本图像集合,其中,所述风格样本图像集合包括N个风格样本图像,所述N为大于1的整数;
将所述风格样本图像集合中的一个风格样本图像作为所述待训练风格样本图像。
3.根据权利要求2所述的训练方法,其特征在于,所述获取风格样本图像集合,包括:
获取待处理风格样本图像集合,其中,所述待处理风格样本图像集合包括K个待处理风格样本图像,所述K为大于所述N的整数;
针对于所述待处理风格样本图像集合中的每个待处理风格样本图像,获取所述每个待处理风格样本图像所对应的嵌入向量特征;
根据第一聚类数量以及所述每个待处理风格样本图像所对应的嵌入向量特征,对所述K个待处理风格样本图像进行聚类处理,得到P个第一聚类中心,其中,所述第一聚类数量为所述P,所述P为大于或等于1,且小于所述K的整数;
根据第二聚类数量以及所述每个待处理风格样本图像所对应的嵌入向量特征,对所述K个待处理风格样本图像进行聚类处理,得到Q个第二聚类中心,其中,所述第二聚类数量为所述Q,所述Q为大于所述P且小于所述K的整数;
获取距离所述每个第一聚类中心最近的嵌入向量特征,得到P个嵌入向量特征;
获取距离所述每个第二聚类中心最近的嵌入向量特征,得到Q个嵌入向量特征;
根据所述P个嵌入向量特征中每个嵌入向量特征所对应的待处理风格样本图像,以及所述Q个嵌入向量特征中每个嵌入向量特征所对应的待处理风格样本图像,生成所述风格样本图像集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110547585.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序