[发明专利]基于人工智能的垃圾投放识别方法、装置、介质及服务器在审
申请号: | 202111277749.7 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113887519A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 刘荣荣 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;B65F1/14 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 垃圾 投放 识别 方法 装置 介质 服务器 | ||
1.一种基于人工智能的垃圾投放识别方法,其特征在于,包括:
通过预设的摄像装置采集目标区域的原始图像帧;
通过预设的人体关节点识别模型对所述原始图像帧进行人体关节点识别,得到人体肘关节点的位置坐标;
通过预设的垃圾袋识别模型对所述原始图像帧进行垃圾袋识别,得到垃圾袋的位置坐标;
根据所述人体肘关节点的位置坐标和所述垃圾袋的位置坐标判断是否发生垃圾投放行为;
若发生垃圾投放行为,则根据所述垃圾袋的位置坐标判断所述垃圾袋是否投放至所述垃圾投放点的垃圾桶中;
若投放至垃圾桶中,则通过预设的垃圾种类识别模型确定所述垃圾袋中的垃圾种类,并根据所述垃圾种类判断垃圾投放是否正确。
2.根据权利要求1所述的垃圾投放识别方法,其特征在于,在通过预设的摄像装置采集目标区域的原始图像帧之后,还包括:
通过预设的图像压缩模型对所述原始图像帧进行图像压缩,得到与所述原始图像帧对应的压缩图像帧;
所述图像压缩模型包括第一卷积神经网络、中间处理网络和第二卷积神经网络,所述通过预设的图像压缩模型对所述原始图像帧进行图像压缩,得到与所述原始图像帧对应的压缩图像帧,包括:
使用所述第一卷积神经网络对所述原始图像帧进行卷积和下采样处理,得到第一处理结果;
使用所述中间处理网络中预设的残差模块对所述第一处理结果进行处理,得到第二处理结果;
使用所述第二卷积神经网络对所述第二处理结果进行卷积和上采样处理,得到与所述原始图像帧对应的压缩图像帧。
3.根据权利要求2所述的垃圾投放识别方法,其特征在于,所述图像压缩模型的训练过程包括:
从预设的训练样本数据库中获取训练样本集合;所述训练样本集合中包括各个训练样本,且每个训练样本均包括一个原始图像帧以及一个预期输出图像帧,其中,每个训练样本中的预期输出图像帧与原始图像帧具有一一对应的关系;
将各个训练样本中的原始图像帧输入所述图像压缩模型中进行图像压缩,得到实际输出图像帧;
计算各个训练样本中的预期输出图像帧与实际输出图像帧之间的第一训练损失值;
若所述第一训练损失值大于预设的第一阈值,则对所述图像压缩模型的模型参数进行调整,直至所述第一训练损失值小于或等于所述第一阈值为止。
4.根据权利要求3所述的垃圾投放识别方法,其特征在于,所述计算各个训练样本中的预期输出图像帧与实际输出图像帧之间的第一训练损失值,包括:
根据下式计算所述第一训练损失值:
其中,n为训练样本的序号,1≤n≤N,N为训练样本的总数,pix为像元的序号,1≤pix≤PixN,PixN为图像中的像元总数,sn,pix为第n个训练样本的预期输出图像帧的第pix个像元的值,yn,pix为第n个训练样本的实际输出图像帧的第pix个像元的值,Loss1为所述第一训练损失值。
5.根据权利要求1所述的垃圾投放识别方法,其特征在于,所述人体关节点识别模型的训练过程包括:
获取预设的训练样本集;所述训练样本集中包括各个样本图像,且每个样本图像均对应于一个预先标注的第一集合;
使用所述人体关节点识别模型分别对所述训练样本集中的各个样本图像进行人体关节点识别,得到各个样本图像对应的第二集合;
根据各个样本图像对应的第一集合和第二集合计算所述训练样本集的第二训练损失值;
若所述第二训练损失值大于预设的第二阈值,则对所述人体关节点识别模型的模型参数进行调整,所述第二训练损失值小于或等于所述第二阈值为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111277749.7/1.html,转载请声明来源钻瓜专利网。