[发明专利]一种基于持续学习的图像分类方法及图像分类装置在审
申请号: | 202211459077.6 | 申请日: | 2022-11-17 |
公开(公告)号: | CN115761343A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 赵旭鹰;赵星;于连源;姚越宇;梁小涛 | 申请(专利权)人: | 首都师范大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/08;G06V10/77;G06N3/082;G06N3/0464 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 于彬 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 持续 学习 图像 分类 方法 装置 | ||
本申请提供了一种基于持续学习的图像分类方法及图像分类装置,包括:基于图像分类模型,确定目标图像的图像类别;图像分类模型通过以下步骤被训练得到:针对任意一个模型训练任务,在按照该模型训练任务对初始图像分类模型进行每轮训练的过程中:判断该模型训练任务在该轮训练时的任务信息是否已进入预设可信区域;若已进入,则按照第一预定方式对初始图像分类模型中前一轮训练得到的每一层对应的投影矩阵进行更新;若未进入,则按照第二预定方式对前一轮训练得到的每一层对应的投影矩阵进行更新;最终确定该轮训练得到的投影矩阵。这样,能够提升训练好的图像分类模型在应用于识别未知类别的图像时,图像分类的准确率和稳定性。
技术领域
本申请涉及深度学习技术领域,尤其是涉及一种基于持续学习的图像分类方法及图像分类装置。
背景技术
近来,随着深度学习的发展,神经网络模型被广泛地应用于语音识别、图像分类和目标检测等领域。其中,在图像分类领域,神经网络模型已取得了很多研究成果,在很多情况下已实现接近人类的识别速度和识别准确率。
然而,神经网络模型不像人类一样具有持续学习能力,即不能够将一个任务的知识用到后一个任务上,并且学习后一个任务时也不会忘记前一个任务。神经网络模型在学习新的任务时,会遗忘先前任务学习到的知识,使得训练好的图像分类模型在应用于识别未知类别的图像时,图像分类的准确率不稳定,在部分图像类别上的分类准确率很低,导致图像分类失败。此外,神经网络模型在训练过程中会不断学习输入数据和输出数据之间的映射关系,而在学习的早期阶段神经网络模型学习到的知识不够准确,这样的知识带来了误导信息,并将误导信息持久地保存在模型中,导致训练好的图像分类模型性能不佳并影响图像分类的准确性。
发明内容
有鉴于此,本申请的目的在于提供一种基于持续学习的图像分类方法及图像分类装置,加入合适的投影矩阵调节模型参数,能够提高模型的持续学习能力,提升训练好的图像分类模型在应用于识别未知类别的图像时,图像分类的准确率和稳定性;此外,设置在模型训练的任务信息进入预设可信区域之后对投影矩阵进行更新,能够避免不可信时的训练任务在模型中产生的误导信息,从而进一步提升图像分类模型的性能和图像分类的准确率。
本申请实施例提供了一种基于持续学习的图像分类方法,所述方法包括:
将待分类的目标图像输入预先训练好的图像分类模型,确定所述目标图像的图像类别;其中,所述图像分类模型通过以下步骤被训练得到:
依次获取持续学习条件下的多个模型训练任务;
依次按照每个模型训练任务对初始图像分类模型进行多轮训练,得到训练好的所述图像分类模型;其中,针对任意一个模型训练任务,在按照该模型训练任务对所述初始图像分类模型进行多轮训练中的每轮训练的过程中:
判断该模型训练任务在该轮训练时初始图像分类模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域;
若在该轮训练时所述初始图像分类模型中该层对应的投影矩阵的任务信息已进入预设可信区域,则按照第一预定方式,根据经前一轮训练得到的所述初始图像分类模型中该层对应的投影矩阵,确定该轮训练得到的该层对应的投影矩阵;其中,每一层对应的初始投影矩阵为矩阵规模与所述初始图像分类模型的模型参数规模相同的单位矩阵;投影矩阵用于在反向传播时更新所述初始图像分类模型的模型参数。
进一步的,所述方法还包括:
若在该轮训练时所述初始图像分类模型中该层对应的投影矩阵的任务信息未进入预设可信区域,则按照第二预定方式,根据经前一轮训练得到的所述初始图像分类模型中该层对应的投影矩阵,确定该轮训练得到的该层对应的投影矩阵。
进一步的,每个模型训练任务包括该模型训练任务对应的预设总训练轮数和预设轮数阈值;所述判断该模型训练任务在该轮训练时初始图像分类模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211459077.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序