[发明专利]一种基于类扩张学习的神经网络模型优化方法有效
申请号: | 201910858852.7 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110796260B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 汪慧;朱文武;赵涵斌;李玺 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 扩张 学习 神经网络 模型 优化 方法 | ||
本发明公开了一种基于类扩张学习的神经网络模型优化方法。具体包括步骤如下:获取用于训练的含有多种类别的样本的数据集,并定义算法目标;用通用模型提取数据集中每类图片的特征,并根据每类特征的分布情况评估各个类别易错的程度;将易错程度最高的几类数据加入训练池,并用训练池中的数据优化神经网络;优化完成后,将剩余易错程度最高的几类数据加入训练池,扩张训练池中的类别,并在上一次训练得到的神经网络基础上用训练池进一步优化神经网络;不断对训练池进行类扩张,直至整个数据集进入训练池,得到最终的优化的神经网络模型。本发明适用于监督学习中的基于多类别数据集的神经网络模型优化,面对各类复杂的情况具有较佳的效果和鲁棒性。
技术领域
本发明属于计算机视觉领域,特别地涉及一种基于类扩张学习的神经网络模型优化方法。
背景技术
神经网络模型的优化方法是人工智能的底层技术,常作为高层视觉任务的基础,例如物体检测,目标识别,语意分割等。然而,受到计算机计算资源和内存资源的限制,目前的神经网络模型的优化方法依赖批随机梯度下降。这种方法是一种迭代式的,批层次的学习模型,每次的训练无法利用全局的数据,只能利用其中一批数据。由于每次训练的数据通常分布在极为稀疏和分散的空间上,神经网络模型的优化难度很大,并且在优化的同时会受大部分简单数据的影响,忽略少量复杂数据的信息。
基于人类的认知学理论,目前课程学习和自步学习逐渐用于解决这种问题。现有的学习方法主要采用的是深度学习框架,输入一个数据集,通过特定的评判指标选出部分数据,然后在这部分数据上训练。在不断的迭代过程中,选出的部分数据会越来越多,直至包含整个数据集,从而达到渐进式地优化神经网络的效果。然而,这类优化方法细节多,实现成本高,复现困难;另一方面,这类方法往往是针对特定任务设计特定评判指标,其评判指标不具有迁移能力。
发明内容
为解决上述问题,本发明的目的在于提供一种基于类扩张学习的神经网络模型优化方法。该方法基于神经网络,将神经网络的全数据集优化转化为渐进式的类扩张优化,强化对易错类别的训练,从而提高神经网络优化效果。
为实现上述目的,本发明的技术方案为:
一种基于类扩张学习的神经网络模型优化方法,该方法以类扩张的模式优化神经网络,包括以下步骤:
S1、获取用于训练的含有多种类别的图片样本的数据集,并定义算法目标;
S2、用通用模型提取数据集中每类图片的特征,并根据每类特征的分布情况评估各个类别易错的程度;
S3、将整个数据集中的易错程度最高的若干类数据加入预先置空的训练池,并用训练池中的数据优化神经网络;
S4、上一轮优化完成后,将未加入训练池的剩余数据集中易错程度最高的若干类数据继续加入训练池,扩张训练池中的类别,并在上一轮训练得到的神经网络的基础上用扩张后的训练池进一步优化神经网络;
S5、不断重复步骤S4对训练池进行类扩张和神经网络优化,直至整个数据集都被加入训练池并完成最后一轮神经网络优化,得到最终优化后的神经网络模型。
进一步的,步骤S1的具体实现步骤包括:
S11:获取包含M个类别的多类别数据集D:
D=C1∪C2…∪CM
其中,Cm表示第m个类别的数据,m=1,2,…,M;
每个类别数据Cm中包含Nm个图片样本x以及他们对应的标签y:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910858852.7/2.html,转载请声明来源钻瓜专利网。