[发明专利]目标类别识别方法、装置及可读存储介质有效

专利信息
申请号: 202111652406.4 申请日: 2021-12-31
公开(公告)号: CN114004963B 公开(公告)日: 2022-03-29
发明(设计)人: 艾国;杨作兴;房汝明;向志宏 申请(专利权)人: 深圳比特微电子科技有限公司
主分类号: G06V10/22 分类号: G06V10/22;G06V10/26;G06V10/44;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 衣淑凤;宋志强
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标 类别 识别 方法 装置 可读 存储 介质
【说明书】:

发明实施例提出目标类别识别方法、装置及可读存储介质。方法包括:对待识别图像进行特征提取,得到第一特征向量;在第一特征向量中查找到各前景和背景区域对应的各第一子特征向量;对各第一子特征向量进行第一插值处理,得到各第二子特征向量;根据各第二子特征向量进行目标检测,得到各目标区域;在第一特征向量中找到各目标区域对应的各第一子特征向量,将各第一子特征向量拼接成第三特征向量;对第一特征向量进行自适应全局平均池化处理,得到第四特征向量;将第四特征向量与第三特征向量进行叠加,得到第五特征向量;根据第五特征向量进行目标类别识别,得到图像中包含的目标类别。本发明实施例更加细化了目标类别识别的粒度。

技术领域

本发明实施例涉及图像处理技术领域,尤其涉及目标类别识别方法、装置及可读存储介质和计算机程序产品。

背景技术

在很多场景中,由于种种目的,需要对目标进行分类。而对于形态和纹理相近的不同目标类别,一般的图像分类方法难以区分。例如:在地下管道建设场景中,近些年来,我国的城市化进程发展迅猛,随着数以亿计的人口涌入城市,地下管道承担的压力进一步加剧,地下管道建设作为城市建设过程中一项非常重要的基础任务,影响着城市正常运行的稳定性,及时检修管网系统,是保证城市基础设施建设稳定性的重要保障。

目前,针对地下管道缺陷检测采用最多的是先通过机器人下井拍摄视频数据,再将获取的海量信息通过人力筛选确定发生缺陷的管道段,生成缺陷类型报告后,再由工人根据报告缺陷类型进行检修。但是人力判断管道缺陷类型有两个方面的缺点,第一:能够筛选管道缺陷类型的人必须具备一定专业知识,这会限制可投入使用的人力数量;第二:人力在工作过程中会产生周期性疲倦,从而导致降低工作效率。上述两个缺陷的叠加导致城市管道检修工作很难及时进行。

目前存在使用神经网络对简单的排水管道破损类别(沉积、裂缝和树根等)分类,由于他们未能有选择地捕获对缺陷类别区分有用地信息,因此难以推广至更多的管道缺陷类别识别之中。

为了能够识别出更多的管道缺陷类别,现有的另一方案在深度卷积神经网络:VGG(Visual Geometry Group,计算机视觉组)16的基础上,在每一个卷积模块中插入CBAM(Convolutional Block Attention Module,卷积块注意力机制)分别计算通道和空间级别的注意力矩阵再用其和原始特征相乘,以此达到使网络管道具有判别力特征的目的,从而将之前管道缺陷分类只能识别三类缺陷推广到了识别变形、腐蚀、结垢、错口、沉积、渗漏以及破裂等七类的程度。这种方法虽然相对于之前的方法相对更具普适性,但是仍然存在几点缺陷:

1)根据我国住房城乡建设部关于发布的行业标准《城镇排水管道检测与评估技术规程》中介绍,地下排水管道缺陷类型共有17种(暗接、变形、错接、残墙、穿入、腐蚀、浮渣、结垢、起伏、树根、脱节、脱落、障碍物、错口、沉积、渗漏以及破裂)。该方法只能识别其中七种最为常见的缺陷类型使得其无法被广泛推广,另一方面也无法达到降低人力投入的目的。因为即便该方法能在这七种缺陷中达到极高识别准确率,但是无法保证剩余10种缺陷是否被认定为正常,而这其他的十类缺陷在排水管道维修中也不可忽视。因此,必须安排人力对模型检测后的数据去做二次筛查。

2)虽然通道和空间级别的注意力机制,能够达到促使神经网络提取样本表达的重要特征,以达到区分类间混淆度大的缺陷类别的目的。但是神经网络的强大拟合能力来自于其成千上万个神经元,在每一个卷积层中插入通道和空间级别注意力机制的计算将会大大加剧模型的计算成本。

3)CBAM本质上是一种自注意力机制,即在当前先验基础上自主选择抑制或增强某些特征信息。但是图像分类的标注信息在特征选择时候能提供的先验信息有限,当需要识别更多而复杂的管道缺陷类别时,CBAM机制难以关注到真正有区分力的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳比特微电子科技有限公司,未经深圳比特微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111652406.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top