[发明专利]一种基于主动学习的垃圾分类方法在审
申请号: | 202011285724.7 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112488162A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 帅猜;舒振宇;龙洋;杨春勇;曲源明 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 孔灿 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 垃圾 分类 方法 | ||
1.一种基于主动学习的垃圾分类方法,其特征在于,包括以下步骤:
S1、数据获取阶段:获取多张未标注的垃圾图片,生成数据集;
S2、模型训练阶段:使用ResNeXt101网络利用BvSB方法对步骤S1获取的数据集进行训练,得到模型model_z;
S3、模型应用阶段:将待分类垃圾图片输入到步骤S2中所得到的模型model_z中,利用softmax函数输出每个类别的概率值,获取最大概率与次大概率的差值,若差值大于阈值P,则将其输出为最大概率对应的类别;若差值小于阈值P,则筛选出该待分类垃圾图片进行人为标注。
2.如权利要求1所述的一种基于主动学习的垃圾分类方法,其特征在于,步骤S1具体包括以下步骤:
S1.1、获取多张垃圾图片作为训练使用数据集;
S1.2、对垃圾图片进行预处理,然后将垃圾图片等比缩放到同一尺寸;
S1.3、将处理后的数据集划分为训练集D、未标记样本集、验证集和测试集。
3.如权利要求2所述的一种基于主动学习的垃圾分类方法,其特征在于,步骤S1.3中的数据集50%用于构建训练集D和未标记样本集,其中每种类别选取十个样本用于构建训练集D,其余样本为未标记样本集;另外50%为验证集和测试集,其中验证集占5%,测试集占95%。
4.如权利要求3所述的一种基于主动学习的垃圾分类方法,其特征在于,步骤S2具体包括以下步骤:
S2.1、将训练集D中的样本进行标注,并对样本进行数据增强操作;
S2.2、将处理后的训练集D输入到ResNeXt101网络中进行训练,得到原始模型;
S2.3、根据原始模型,运用BvSB方法对未标记样本集进行筛选,满足条件的样本放入到训练集D,不满足条件的样本放回未标记样本集;
S2.4、对新放入训练集D的样本进行标注,并进行数据增强操作;
S2.5、将新放入训练集D的样本输入到原始模型对其进行再训练,得到模型model_x,并将其作为初始模型;
S2.6、重复上述S2.3-S2.5,直到达到指定的迭代次数,保存最终得到的模型model_z;
S2.7、保存最后一次迭代由BvSB方法所得最大概率与次大概率差值记为阈值P。
5.如权利要求4所述的一种基于主动学习的垃圾分类方法,其特征在于:步骤S2.4中标注类别包括可回收垃圾、厨余垃圾、有害垃圾、其他垃圾四个一级标签,以及n个二级标签。
6.如权利要求4所述的一种基于主动学习的垃圾分类方法,其特征在于:数据增强操作包括随机噪声、随机擦除、随机裁剪、Mixup和CutMix,数据增强操作用于提升标注样本的泛化能力。
7.如权利要求5所述的一种基于主动学习的垃圾分类方法,其特征在于:步骤S2.2中的ResNeXt101网络包括五个bottleneck和两个全连接层,且每个bottleneck后加有cbam注意力机制,用于提升其特征表征能力,在两个全连接层之间加有dropout,随机丢弃一些神经元,防止模型过拟合,将最后一个全连接层连接softmax函数,最后输出各个类别的概率。
8.如权利要求7所述的一种基于主动学习的垃圾分类方法,其特征在于:将待筛选的样本输入模型model_z中,经softmax函数输出各个类别的概率,将最大概率以及次大概率记为Pfirst、Psecond,则其中,xi为表示训练集D里的第i个样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011285724.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温报警式工业型开关电源
- 下一篇:消防应急通信系统及其应用方法