[发明专利]一种图像识别模型的训练方法、图像识别的方法及装置有效
申请号: | 202010182180.5 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111401445B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 李一鸣;吴保元;张勇;樊艳波;李志锋;刘威;冯岩;江勇;夏树涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 模型 训练 方法 装置 | ||
本申请公开了一种图像识别模型的训练方法,该方法用于人工智能领域,该方法包括:获取训练数据集合;调用图像识别模型对训练数据集合中的第一图像的类别进行预测,得到第一预测标签;调用图像识别模型对训练数据集合中的第二图像的类别进行预测,得到第二预测标签;对第二图像进行加扰处理得到第三图像;调用图像识别模型对第三图像的类别进行预测,得到第三预测标签;根据第一图像所对应的标签、第一图像所对应的第一预测标签、第二图像所对应的第二预测标签以及第三图像所对应的第三预测标签,对图像识别模型的第一模型参数进行更新。本申请公开了一种图像识别的方法和装置。本申请通过半监督学习提升模型的识别能力,增强模型的鲁棒性。
技术邻域
本申请涉及人工智能领域,尤其涉及一种图像识别模型的训练方法、图像识别的方法及装置。
背景技术
深度学习占据着机器视觉邻域的重要地位,在机器视觉邻域中,深度学习成为了从自动驾驶以及安保等方面的主力。尽管深度网络已经在处理复杂问题时所取得了现象级的成功,但是对于带有轻微扰动的图像而言,仍然容易出现识别错误的情况。
为了能够抵御这类图像对模型识别的干扰,目前,提出了一种对抗防御方法,即不断输入新类型的样本并执行对抗训练,不断提升网络的鲁棒性。为了保证训练的有效性,该方法需要大量带有标签的训练数据,通过对抗训练可以提升模型的鲁棒性。
然而,由于对图像进行干扰的方式较多,即使在训练的过程中增加大量的样本,仍然难以覆盖所有的样本,总是会存在新的攻击样本来欺骗网络,难以提升模型的防御性能,对图像的识别精度不高。
发明内容
本申请实施例提供了一种图像识别模型的训练方法、图像识别的方法及装置,利用了有标签数据和无标签数据对模型进行半监督训练,对于无标签的图像而言对其进行加扰,使得模型在训练过程中对是否加扰过的图像进行识别,从而提升模型的识别能力,增强模型的鲁棒性。
有鉴于此,本申请第一方面提供一种图像识别模型的训练方法,包括:
获取训练数据集合,其中,训练数据集合包括至少一个具有标签的图像样本对以及至少一个不具有标签的图像;
调用图像识别模型对训练数据集合中的第一图像的类别进行预测,得到第一图像所对应的第一预测标签;
调用图像识别模型对训练数据集合中的第二图像的类别进行预测,得到第二图像所对应的第二预测标签;
对第二图像进行加扰处理,得到第三图像;
调用图像识别模型对第三图像的类别进行预测,得到第三图像所对应的第三预测标签,其中,第三图像与第二图像具有对应关系;
根据第一图像所对应的标签、第一图像所对应的第一预测标签、第二图像所对应的第二预测标签以及第三图像所对应的第三预测标签,对图像识别模型的第一模型参数进行更新。
本申请第二方面提供一种图像识别的方法,包括:
获取待识别图像;
调用图像识别模型对待识别图像的类别进行预测,得到图像类别结果,其中,图像识别模型为第一方面所描述的图像识别模型;
向客户端发送图像类别结果,以使客户端展示图像类别结果。
本申请第三方面提供一种图像识别模型训练装置,包括:
获取模块,用于获取训练数据集合,其中,训练数据集合包括至少一个具有标签的图像样本对以及至少一个不具有标签的图像;
预测模块,用于调用图像识别模型对训练数据集合中的第一图像的类别进行预测,得到第一图像所对应的第一预测标签;
预测模块,还用于调用图像识别模型对训练数据集合中的第二图像的类别进行预测,得到第二图像所对应的第二预测标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182180.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序