[发明专利]一种基于计算机视觉的垃圾分类软件在审
申请号: | 201911045897.9 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110929760A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 冷聪;姜振涛 | 申请(专利权)人: | 中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 窦贤宇 |
地址: | 211000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算机 视觉 垃圾 分类 软件 | ||
1.一种基于计算机视觉的垃圾分类软件,包括移动端图像采集系统、垃圾类别数据系统、垃圾判定识别系统和个性化用户升级系统,利用移动端对垃圾进行拍摄,进一步通过学习模型进行垃圾类别识别,从而完成垃圾分类;
移动端图像采集系统,直接通过移动端的照相功能采集待识别垃圾的图像;
垃圾类别数据系统,前期通过收集大量的垃圾照片进行常用垃圾类别学习,建立垃圾分类识别的学习模型和数据库,利用深度学习模式对垃圾类别数据进行高强度的学习和训练;
垃圾类别判定系统,根据所述垃圾类别数据系统对已拍摄的垃圾照片学习后的结果,与学习模型中的类别进行结果匹配,获得类别结果;
个性化用户升级系统,针对用户习惯性产出的垃圾进行新增门目,从而考虑到不同用户的特殊性,保证垃圾分类的准确性;
所述移动端图像采集系统,其特征在于,用户在移动客户端上安装垃圾分类软件时,需要给与垃圾分类软件一定的操作权限,即垃圾分类软件需要获取移动端的图像使用权限,具体步骤为:
步骤1、使用移动端的图像采集设备,根据用户需求去采集垃圾图像,可以直接访问用户移动端中已经存储的图像或者直接利用拍摄装置进行图像拍摄;
步骤2、将采集到不明垃圾的图像导入垃圾分类系统中的深度学习模型里,与学习模型中的垃圾分类数据进行图像比对;
步骤3、经过深度学习模型中层层计算,最终计算出图像中各部分垃圾分类标签,并将分类标签呈现在之前采集的图像上,此时用户可以根据图像上的标签结果将垃圾正确的进行分类。
2.根据权利要求1所述的一种基于计算机视觉的垃圾分类软件,其特征在于,所述垃圾类别数据系统通过仿照人工神经网络的模式进行垃圾图片分类学习,从而获得对垃圾类别数据的高准确度判断,具体步骤为:
步骤1、收集大量的垃圾类别数据;
步骤11、通过在互联网上收集到的专项垃圾图片构建垃圾类别的数据库,图片搜索方式主要分成:干垃圾、湿垃圾、有害垃圾和可回收垃圾四类;
步骤12、针对每一个种类的垃圾类别,需要进行常用垃圾识别并进行图像学习,具体根据常用网站的垃圾分类识别的前五十种进行图片搜索,保证常用垃圾能够快速获得识别结果;
步骤13、最终学习到的垃圾类别数据由垃圾图像和垃圾图像上的标签两部分组成,标签是对应每张图像的垃圾位置及其类别;
步骤2、将垃圾类别数据进行划分为训练集和测试集,训练集将用于深度学习模型的高强度训练和学习,测试集用于测试深度学习模型学到的垃圾分类能力,并根据测试结果对该模型进一步的优化和更新。
3.根据权利要求1所述的一种基于计算机视觉的垃圾分类软件,其特征在于,所述垃圾类别数据系统需要进行深度学习模型的构建,具体可以分成卷积层、池化层和数据激活层;其中,当获得待分类垃圾的图像后,通过多通道对图像数据的信息进行输入并卷积,卷积层的每个卷积产生一个通道的输出,从而可以得到多个通道的输出,其中,卷积定义为:
其中,z[x,y]是计算结果,g[x,y]是输入数据,f[x,y]是卷积核,*表示卷积操作;
对于输入通道的每一个数值需要通过激活函数进行数值修改,从而获得相同大小的输出,这种计算过程在激活层中完成,具体可以使用Relu函数:
f(x)=max(0,x)
对于输出数据,需要在池化层进行按比例采样,其采样方法可以表示为:
f(X)=max([X])
最后,深度学习模型可构建出识别出垃圾分类的结果图;输入待分类的垃圾图像,,图像经过多次卷积过程和激活过程后,经过池化操作得到多维特征图,根据特征图进行边框回归计算从而判断边框内的类别,之后根据图像实际情况优化网络结构和参数。
4.根据权利要求1所述的一种基于计算机视觉的垃圾分类软件,其特征在于,所述垃圾类别判定系统将采集到的图像与深度学习模式中的垃圾分类图像进行匹配对比之后可以初步划定垃圾类别,进一步通过进入学习模式的训练和学习,保证垃圾分类的最终类别判定的准确度,最终在原图像上直接显示垃圾分类后的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所,未经中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911045897.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于唇语指令的终端解锁方法
- 下一篇:石墨烯-金属复合料的制备方法