[发明专利]一种图像识别模型的训练方法、图像识别的方法及装置有效
申请号: | 202010182180.5 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111401445B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 李一鸣;吴保元;张勇;樊艳波;李志锋;刘威;冯岩;江勇;夏树涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 模型 训练 方法 装置 | ||
1.一种图像识别模型的训练方法,其特征在于,包括:
获取训练数据集合,其中,所述训练数据集合包括至少一个具有标签的图像样本对以及至少一个不具有标签的图像;
调用图像识别模型对所述训练数据集合中的第一图像的类别进行预测,得到所述第一图像所对应的第一预测标签;
调用所述图像识别模型对所述训练数据集合中的第二图像的类别进行预测,得到所述第二图像所对应的第二预测标签;
获取图像攻击类型的数量;
若所述图像攻击类型的数量大于1,则确定图像加扰类型为复合攻击类型;
基于通用的扰动邻域定义,根据所述图像加扰类型确定扰动邻域,其中,所述扰动邻域表示对未加扰图像进行图像变换的范围;所述通用的扰动邻域定义包括最大变换范围,所述最大变换范围包括最大几何变换范围中旋转变换范围、最大几何变换范围中平移变换范围与最大像素变换范围;所述根据所述图像加扰类型确定扰动邻域,包括:
若所述图像加扰类型为复合攻击类型,则获取至少两个图像攻击类型;
若所述至少两个图像攻击类型包括像素攻击类型以及几何攻击类型,则获取图像攻击顺序;
若所述图像攻击顺序为先采用像素攻击类型,再采用几何攻击类型,则获取第一复合变换函数所对应的第一复合距离度量,其中,所述像素攻击类型为对所述未加扰图像中的至少一个像素值进行变换,所述几何攻击类型为对所述未加扰图像进行平移以及旋转中的至少一种变换;
根据所述第一复合距离度量以及最大几何变换范围中旋转变换范围与最大几何变换范围中平移变换范围,确定所述扰动邻域;
若所述图像攻击顺序为先采用几何攻击类型,再采用像素攻击类型,则获取第二复合变换函数所对应的第二复合距离度量;
根据所述第二复合距离度量以及最大像素变换范围,确定所述扰动邻域;
基于所述扰动邻域以及所述第二图像所对应的第二预测标签,确定第三优化函数;
当第三优化函数达到最大值时,获取所述第二图像所对应的第三图像;
调用所述图像识别模型对所述第三图像的类别进行预测,得到所述第三图像所对应的第三预测标签;
根据所述第一图像所对应的标签、所述第一图像所对应的第一预测标签、所述第二图像所对应的第二预测标签以及所述第三图像所对应的第三预测标签,对所述图像识别模型的第一模型参数进行更新。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一图像所对应的标签、所述第一图像所对应的第一预测标签、所述第二图像所对应的第二预测标签以及所述第三图像所对应的第三预测标签,对所述图像识别模型的第一模型参数进行更新,包括:
根据所述第一图像所对应的标签以及所述第一图像所对应的第一预测标签,确定第一风险函数,其中,所述第一风险函数用于表示预测标签与标签之间的差异;
根据所述第二图像所对应的第二预测标签以及所述第三图像所对应的第三预测标签,确定第二风险函数,其中,所述第二风险函数用于表示已加扰图像与未加扰图像之间的差异;
根据所述第一风险函数以及第二风险函数,生成目标优化函数;
当所述目标优化函数达到最小值时,获取第二模型参数;
将所述图像识别模型的所述第一模型参数更新为所述第二模型参数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一风险函数以及第二风险函数,生成目标优化函数,包括:
采用第一损失函数对所述第一风险函数进行变换处理,得到第一优化函数,其中,所述第一优化函数包括图像的预测分布向量与标签之间的损失值;
采用第二损失函数对所述第二风险函数进行变换处理,得到第二优化函数,其中,所述第二优化函数包括所述已加扰图像的预测分布向量与所述未加扰图像的预测标签之间的损失值;
根据所述第一优化函数与所述第二优化函数,生成所述目标优化函数。
4.根据权利要求1所述的方法,其特征在于,
若所述图像攻击类型的数量等于1,则确定所述图像加扰类型为单攻击类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182180.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序