[发明专利]基于少量标注样本的增量学习方法及系统在审
申请号: | 202010840523.2 | 申请日: | 2020-08-20 |
公开(公告)号: | CN112132179A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 卢记仓;周刚;兰明敬;张伟;陈静;吴建萍 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 少量 标注 样本 增量 学习方法 系统 | ||
1.一种基于少量标注样本的增量学习方法,其特征在于,包含如下内容:
收集样本数据,包含:少量已标注样本和大量未标注样本;
对少量已标注样本进行扩充增强,获得可靠标签数据集,利用该可靠标签数据集对网络进行学习获得预训练模型,调整模型收敛参数和配置;基于学习后的网络预训练模型,对大量未标注样本进行预测分类,依据分类结果构建增量学习候选数据集;
将可靠标签数据集和增量学习候选数据集组合得到增量学习数据集;利用该增量学习数据集对网络预训练模型进行增量学习,并利用可靠标签数据集对增量学习所得模型进行校准学习;
利用校准学习后的预训练模型对未标注数据进行预测分类,通过设置是否达到预设期望的循环迭代条件来判定是否返回重新执行构建增量学习候选数据集及增量学习和校准学习步骤内容。
2.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,针对少量已标注样本,依据样本数据的类型及分布特性,利用数据增强方法对其进行扩充增强来获取可靠标签数据集。
3.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,基于学习后的网络预训练模型,对大量未标注样本进行预测分类识别,得到各样本分别属于各类别的得分值,将得分值大于预设选择阈值的样本作为增量学习候选数据,并以得分值确定的类别对样本添加临时标签,构建增量学习候选数据集。
4.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,按照模型收敛参数和配置,利用增量学习数据集对网络预训练模型进行增量学习,以通过模型训练得到扩展预训练模型。
5.根据权利要求4所述的基于少量标注样本的增量学习方法,其特征在于,针对扩展预训练模型,利用可靠标签数据集进行校准学习,以通过模型训练消除增量学习中引入的噪声。
6.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,预设期望的循环迭代条件为预先设置的循环迭代次数。
7.一种基于少量标注样本的增量学习系统,其特征在于,包含:收集模块,扩充模块,增量校准模块和循环迭代模块,其中,
收集模块,用于收集样本数据,包含:少量已标注样本和大量未标注样本;
扩充模块,用于对少量已标注样本进行扩充增强,获得可靠标签数据集,利用该可靠标签数据集对网络进行学习获得预训练模型,调整模型收敛参数和配置;基于学习后的网络预训练模型,对大量未标注样本进行预测分类,依据分类结果构建增量学习候选数据集;
增量校准模块,用于将可靠标签数据集和增量学习候选数据集组合得到增量学习数据集;利用该增量学习数据集对网络预训练模型进行增量学习,并利用可靠标签数据集对增量学习所得模型进行校准学习;
循环迭代模块,用于利用校准学习后的所得模型对未标注数据进行预测分类,通过设置是否达到预设期望的循环迭代条件来判定是否返回重新执行构建增量学习候选数据集及增量学习和校准学习步骤内容。
8.一种用于视觉类数据分类识别方法,其特征在于,包含如下内容:
分析视觉类数据的图像通道数量、尺寸及类别数量信息,选取用于图像类数据分析的卷积神经网络深度学习模型作为网络预训练模型;
并采用权利要求1~6任一项所述的基于少量标注样本的增量学习方法,在少量标注样本情况下基于网络预训练模型及迭代增量学习和校准学习对大量未标注样本数据进行分类识别。
9.一种用于自然语言数据分析处理方法,其特征在于,包含如下内容:
分析文本数据长度、领域、向量表示及分析任务,选取用于文本类数据分析的深度学习网络模型;并采用权利要求1~6任一项所述的基于少量标注样本的增量学习方法,在少量标注样本情况下基于网络预训练模型及迭代增量学习和校准学习对大量未标注样本数据进行分类识别。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时执行权利要求1~6任一项所述的增量学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010840523.2/1.html,转载请声明来源钻瓜专利网。