[发明专利]一种基于深度学习的垃圾分类与识别的方法及系统在审
申请号: | 202310459746.8 | 申请日: | 2023-04-26 |
公开(公告)号: | CN116416476A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 刘艨霆;沈骞;胡婷;杨晟尧;徐寅 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/80;G06N3/0464;G06N3/084 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王安琪 |
地址: | 223003 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 垃圾 分类 识别 方法 系统 | ||
1.一种基于深度学习的垃圾分类与识别的方法,其特征在于,包括以下步骤:
步骤S1:获取包含多种类垃圾图像的数据集;
步骤S2:对数据集中的图像进行预处理,并将预处理好的数据集划分为训练集和测试集;
步骤S3:选择ResNet-50网络结构作为预训练模型,采用迁移学习的方式对预训练模型进行训练及微调;
步骤S4:在微调后的预训练模型中引入CBAM注意力机制模块,构建垃圾分类模型;
步骤S5:对垃圾分类模型进行性能分析。
2.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法,其特征在于,步骤S2所述的对数据集中的图像进行预处理,包括数据标注、数据分析、图像缩放裁剪、图像数据标准化、数据增广;
其中,数据标注是指对数据集中每张图像进行分类和编号;
数据分析是指去除掉垃圾数据集中,因图像种类、长宽差异性及拍摄环境不同导致整体数据不均匀、质量差的图像;
图像数据标准化是指对图像进行归一化操作,把不同维度的特征值调整到相近的范围内;
数据增广是指对数据集进行扩充,以增加数据集内图像数量。
3.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法,其特征在于,所述的归一化操作为:
式中,output为图像像素值输出,input为图像像素值输入,max与min为最大像素值与最小像素值,经过归一化处理,将图像的像素值调整到(0,1)区间内。
4.根据权利要求2所述的基于深度学习的垃圾分类与识别的方法,其特征在于,所述的数据增广包括采用颜色增强、水平翻转、垂直翻转、图像锐化、高斯噪声以及高斯模糊对垃圾数据集内图像进行变换操作。
5.根据权利要求1所述的基于深度学习的垃圾分类与识别的方法,其特征在于,步骤S3所述的采用迁移学习的方式对预训练模型进行训练及微调,具体为:冻结预训练模型中靠近输入端的卷积块,保持起始层权重不变,用训练集训练剩余靠近输出端的卷积块和全连接分类器,得到新的权重,其中新的权重是用初始权重减去反向传播的误差,当反向传播的误差为正时,减小权重的数值,当反向传播的误差为负时,增加权重的数值;
使用训练集和测试集对微调后的模型进行测试,评估微调后的模型关于训练集的准确率Train_Accuracy、损失值Train_Loss,以及测试集的准确率Val_Accuracy、损失值Val_Loss。
6.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法,其特征在于,其中所述的准确率为
上述公式(2)中,TP表示被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;TN表示被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数;FP表示被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;FN表示被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数。
7.根据权利要求5所述的基于深度学习的垃圾分类与识别的方法,其特征在于,其中所述的损失值为
上式公式(3)中,N为样本总数,i表示其中一个输出样本,y是实际值,x是预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310459746.8/1.html,转载请声明来源钻瓜专利网。