[发明专利]目标类别识别方法、训练方法及可读存储介质有效
申请号: | 202210000748.6 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114004838B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 艾国;凌明;杨作兴;房汝明;向志宏 | 申请(专利权)人: | 深圳比特微电子科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V20/40;G06V10/764;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 衣淑凤;宋志强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 类别 识别 方法 训练 可读 存储 介质 | ||
本发明实施例提出目标类别识别方法、训练方法及可读存储介质。方法包括:对待识别图像进行特征提取,得到第一特征向量;对第一特征向量分别进行不同粒度下的特征降解,对不同粒度下得到的特征降解后的特征向量分别进行空间级别的注意力系数计算;对于每一粒度下每个通道中的每个特征值,将该特征值与该特征值的注意力系数相乘,得到第二特征向量;分别采用不同粒度下的第二特征向量进行目标分类计算,得到不同粒度下待识别图像中含有各目标类别的概率;对于每一目标类别,对不同粒度下待识别图像中含有该目标类别的概率进行加权计算,得到待识别图像中含有该目标类别的最终概率。本发明实施例更加细化了目标类别识别的粒度。
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及目标类别识别方法、用于目标类别识别的神经网络的训练方法、及可读存储介质和计算机程序产品。
背景技术
在很多场景中,由于种种目的,需要对目标进行分类。而对于形态和纹理相近的不同目标类别,一般的图像分类方法难以区分。例如:在地下管道建设场景中,近些年来,我国的城市化进程发展迅猛,随着数以亿计的人口涌入城市,地下管道承担的压力进一步加剧,地下管道建设作为城市建设过程中一项非常重要的基础任务,影响着城市正常运行的稳定性,及时检修管网系统,是保证城市基础设施建设稳定性的重要保障。
目前,针对地下管道缺陷检测采用最多的是先通过机器人下井拍摄视频数据,再将获取的海量信息通过人力筛选进行缺陷类型评判,最后生成相关报告。例如,现有的方法是使用单幅图像输入实现了不同管道缺陷的分类。但是该方法具有如下不足之处:
一、该方法忽略了管道缺陷的一个独有问题,即大多数关键缺陷类型分布广,但是实际占据面积比例小,如:树根、裂缝、错口等缺陷类型,针对这些缺陷类型,该方法不能很好地进行区分。
二、该方法基于单幅图像提取得到的全局特征做缺陷分类,容易使得模型无法捕获缺陷本身具有鉴别性的信息,易受到背景等噪声影响。
三、当两类缺陷在形态、纹理相似度较高时,如:腐蚀、结垢等缺陷类型,该方法提供的模型无法依赖全局上的笼统语义信息区分它们。
由于上述限制,该方法只能局限应用于七类管道类型缺陷,包括:变形、腐蚀、结垢、错口、沉积、渗漏以及破裂。而根据我国住房城乡建设部关于发布的行业标准《城镇排水管道检测与评估技术规程》中介绍,地下排水管道缺陷类型共有17种,包括:暗接、变形、错接、残墙、穿入、腐蚀、浮渣、结垢、起伏、树根、脱节、脱落、障碍物、错口、沉积、渗漏以及破裂。显然该方法无法有效准确地区分完整的17种缺陷类型。此外,管道数据初始来源于视频数据,如能实现管道视频数据全粒度(即17种缺陷类别)的缺陷分类,将能极大促进城市地下管网的检修工作进行。
发明内容
本发明实施例提出目标类别识别方法、用于目标类别识别的神经网络的训练方法、及可读存储介质和计算机程序产品,以细化目标类别识别的类别粒度,并提高目标类别识别的识别精度。
本发明实施例的技术方案是这样实现的:
一种目标类别识别方法,该方法包括:
对待识别图像进行特征提取,得到第一特征向量,第一特征向量的维度为C1*H1*W1,其中,C1为预设的通道数,H1为预设的每个通道的特征长度,W1为预设的每个通道的特征宽度;
对第一特征向量分别进行不同粒度下的特征降解,对不同粒度下得到的特征降解后的特征向量分别进行空间级别的注意力系数计算,得到不同粒度下每个通道的每个特征值的注意力系数;
对于每一粒度下每个通道中的每个特征值,将特征值与特征值的注意力系数相乘,得到特征值对应的空间增强特征值,每一粒度下的所有通道的所有空间增强特征值构成所述粒度下的第二特征向量;
分别采用不同粒度下的第二特征向量进行目标分类计算,得到不同粒度下待识别图像中含有各目标类别的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳比特微电子科技有限公司,未经深圳比特微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210000748.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LNG过驳作业BOG管理系统
- 下一篇:切换用夹管阀阀头及夹管阀阀组