[发明专利]图像识别模型的训练、图像识别方法、装置及设备有效
申请号: | 202010657011.2 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111783898B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 沈力;申丽;黄浩智;李志锋;刘威 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/27;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 设备 | ||
本公开涉及一种图像识别模型的训练、图像识别方法、装置及设备。该图像识别模型的训练过程通过Frank‑Wolfe算法来自适应的动态调整权重系数,并且通过模型参数更新阶段和权重系数更新阶段的交替执行来实现图像识别模型的训练,可以提高图像识别模型训练的自动化程度以及降低权重系数的调整成本。并且通过Frank‑Wolfe算法动态调整权重系数,能够避免人为调整权重系数的不确定性的影响,可以保证权重系数不断得到优化,使得第二图像识别模型可以达到与第一图像识别模型类似的图像识别准确率,可以在实际应用中提高图像处理技术中图像识别的准确率。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种图像识别模型的训练、图像识别方法、装置及设备。
背景技术
目前越来越多的领域需要用到图像识别模型进行图像识别处理,为了满足该需求,现有多采用知识蒸馏技术将训练好的复杂度较高的图像识别模型 (教师模型)进行压缩得到学生模型,这样可以高效的获取参数小、结构简单、容易部署的图像识别模型,从而可以高效的满足各领域对图像识别模型的需求。但是目前的知识蒸馏技术大多是人工手动调整损失函数的权重系数,这会增加学生模型训练的成本和难度,并且手动调整的方式会导致学生模型的图像识别准确率不高。
发明内容
有鉴于上述存在的技术问题,本公开提出了一种图像识别模型的训练、图像识别方法、装置及设备。
根据本公开的一方面,提供了一种图像识别模型的训练方法,包括:
获取第一图像识别结果,所述第一图像识别结果是将图像样本集输入第一图像识别模型得到的;
确定损失函数对应的当前的权重系数,所述损失函数包括第一损失函数和多个第二损失函数;
模型参数更新阶段:将所述图像样本集输入当前的第二图像识别模型,得到当前的第二图像识别结果;根据所述第一损失函数和多个第二损失函数,分别确定当前的第二图像识别结果和所述图像样本集的标签信息间的第一梯度信息、以及当前的第二图像识别结果与所述第一图像识别结果间的第二梯度信息;根据当前的权重系数、第一梯度信息和第二梯度信息,更新所述第二图像识别模型的模型参数,至模型参数更新阶段的迭代次数满足模型参数迭代条件;确定模型训练次数,当模型训练次数达到训练次数阈值时,将当前的第二图像识别模型作为目标图像识别模型;当模型训练次数未达到训练次数阈值时,将所述图像样本集输入当前的第二图像识别模型,得到当前的第二图像识别结果,并进入权重系数更新阶段;
权重系数更新阶段:根据所述第一损失函数和多个第二损失函数,分别确定当前的第二图像识别结果和所述图像样本集的标签信息间的第一梯度信息、以及当前的第二图像识别结果与所述第一图像识别结果间的第二梯度信息;根据当前的权重系数、第一梯度信息、第二梯度信息和Frank-Wolfe算法,更新权重系数,至权重系数更新阶段的迭代次数满足权重系数迭代条件;并在权重系数更新阶段的迭代次数满足权重系数迭代条件时,进入模型参数更新阶段。
根据本公开的另一方面,提供了一种图像识别方法,包括:
获取待识别图像;
将所述待识别图像输入目标图像识别模型,获取图像识别结果。
根据本公开的另一方面,提供了一种图像识别模型的训练装置,包括:
第一图像识别结果获取模块,用于获取第一图像识别结果,所述第一图像识别结果是将图像样本集输入第一图像识别模型得到的;
权重系数确定模块,用于确定损失函数对应的当前的权重系数,所述损失函数包括第一损失函数和多个第二损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010657011.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序