[发明专利]一种基于主动学习的垃圾分类方法在审
申请号: | 202011285724.7 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112488162A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 帅猜;舒振宇;龙洋;杨春勇;曲源明 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 孔灿 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 垃圾 分类 方法 | ||
本发明提供一种基于主动学习的垃圾分类方法,包括以下步骤:S1、数据获取阶段:获取多张未标注的垃圾图片,生成数据集;S2、模型训练阶段:利用BvSB方法对步骤S1获取的数据集进行训练,得到模型model_z;S3、模型应用阶段:将待分类垃圾图片输入到模型model_z中,利用softmax函数输出每个类别的概率值,获取最大概率与次大概率的差值,若差值大于阈值P,则将其输出为最大概率对应的类别;若差值小于阈值P,则筛选出该待分类垃圾图片进行人为标注。本发明的有益效果:本发明可以使用较小的标注成本就能够达到很高的准确率,并且其准确率还会随着测试样本的增多而提高,可以将其利用在垃圾桶或者其他装置中,可较好减少垃圾分类错误的现象。
技术领域
本发明涉及垃圾分类技术领域,尤其涉及一种基于主动学习的垃圾分类方法。
背景技术
随着经济的快速发展以及城市化进程的加快,人们在生产生活中产生的垃圾也越来越多,对垃圾进行分类已成为迫切需要解决的问题。有效的垃圾分类可以减少对环境的污染以及可利用资源的再回收。
然而要实现准确的垃圾分类,需要大量关于垃圾分类的知识储备。由于人们普遍对这方面的知识比较匮乏,其分类效果并不好。为此已有学者提出了通过计算机视觉的方法实现对垃圾的自动分类,通过对带标签的数据利用分类器进行训练,可以得到一个保存有各种垃圾特征的分类模型,通过将垃圾图片输入到分类模型可以得到自动分类结果。
这种方法在很大程度上可以实现对垃圾的准确分类,但是这种方法所得到的模型的精度往往依靠于训练使用的庞大数据集。由于垃圾种类的繁多,要建立这样带有标签的庞大的数据集需要巨大的工作量。同时,在实际应用场景对于分类错误的情况没有很好的解决方案。
发明内容
有鉴于此,本发明提供一种基于主动学习的垃圾分类方法,在保证模型精度的同时减小数据标注的工作量,且对实际应用场景中分类错误的情况加以考虑,让其进一步对模型进行优化。
本发明的实施例提供一种基于主动学习的垃圾分类方法,包括以下步骤:
S1、数据获取阶段:获取多张未标注的垃圾图片,生成数据集;
S2、模型训练阶段:使用ResNeXt101网络利用BvSB方法对步骤S1获取的数据集进行训练,得到模型model_z;
S3、模型应用阶段:将待分类垃圾图片输入到步骤S2中所得到的模型model_z中,利用softmax函数输出每个类别的概率值,获取最大概率与次大概率的差值,若差值大于阈值P,则将其输出为最大概率对应的类别;若差值小于阈值P,则筛选出该待分类垃圾图片进行人为标注。
进一步地,步骤S1具体包括以下步骤:
S1.1、获取多张垃圾图片作为训练使用数据集;
S1.2、对垃圾图片进行预处理,然后将垃圾图片等比缩放到同一尺寸;
S1.3、将处理后的数据集划分为训练集D、未标记样本集、验证集和测试集。
进一步地,步骤S1.3中的数据集50%用于构建训练集D和未标记样本集,其中每种类别选取十个样本用于构建训练集D,其余样本为未标记样本集;另外50%为验证集和测试集,其中验证集占5%,测试集占95%。
进一步地,步骤S2具体包括以下步骤:
S2.1、将训练集D中的样本进行标注,并对样本进行数据增强操作;
S2.2、将处理后的训练集D输入到ResNeXt101网络中进行训练,得到原始模型;
S2.3、根据原始模型,运用BvSB方法对未标记样本集进行筛选,满足条件的样本放入到训练集D,不满足条件的样本放回未标记样本集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011285724.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温报警式工业型开关电源
- 下一篇:消防应急通信系统及其应用方法