[发明专利]基于语义特征一致性监督金字塔网络的目标检测方法有效

专利信息
申请号: 202011458846.1 申请日: 2020-12-11
公开(公告)号: CN112529005B 公开(公告)日: 2022-12-06
发明(设计)人: 何立火;柯俊杰;甘海林;韩博;高新波;唐杰浩;路文;蔡虹霞 申请(专利权)人: 西安电子科技大学
主分类号: G06V20/70 分类号: G06V20/70;G06V10/774;G06V10/82;G06V10/80;G06V10/764;G06V10/25;G06N3/04;G06N3/08
代理公司: 陕西电子工业专利中心 61205 代理人: 陈宏社;杨春岗
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 特征 一致性 监督 金字塔 网络 目标 检测 方法
【说明书】:

本发明提出了一种基于语义特征一致性金字塔网络的图像目标检测方法,用于解决现有技术中存在的因为图像或视频目标检测过程中目标多尺度语义特征融合时不一致导致的检测精度较低的技术问题,实现步骤为:获取训练样本集K和测试样本集V;构建基于语义特征一致性金字塔网络P的图像目标检测网络S;对基于语义特征一致性金字塔网络P的图像目标检测网络S进行迭代训练;获取目标检测识别结果。本方法在主流RCNN目标检测网络中即插即用,解决了不同层语义特征融合时不一致导致的检测精度较低的技术问题提高了检测精度。

技术领域

本发明属于图像处理中的计算机视觉技术领域,涉及一种基于深度学习的目标检测方法,具体涉及一种基于语义特征一致性监督金字塔网络的目标检测方法,可用于RGB光学图像与视频中的目标检测。

背景技术

随着计算机技术的发展和人工智能时代的到来,计算机视觉领域技术突飞猛进,目标检测技术也取得了突破性的成果。目标检测是计算机视觉领域的核心问题之一,其任务是找出图像中所有感兴趣的目标,确定它们的位置和大小。人脸检测、行人检测、车辆检测等重要目标的检测被广为研究,不仅如此,在安全、交通、医疗等领域目标检测均得到了广泛的应用。因此,为了获得满意的图像物体检测效果,设计相应算法有效地检测图像目标成为一个广泛而基本的问题。

传统的目标检测方法利用手工设计特征,使用与图所包含目标边缘相关的滤波器对规则物体进行滤波,对于单一目标检测,手工设计特征的方法在清晰可见的图像中检测精度显著提升,但此方法在复杂场景下难以准确匹配目标,鲁棒性较差。随着卷积神经网络的发展,基于卷积神经网络的目标检测算法成为主流算法,该算法通过学习大量的标注训练数据的特征来提升模型对特征的识别能力

随着深度卷积网络的发展,基于深度学习的目标检测算法成为研究热点。深度卷积网络可通过学习并融合图像中目标的浅层定位信息与深层语义信息来增强对图像感兴趣区域的激活值,进而对目标的显著特征识别,达到对图像中目标的检测。在基于深度卷积网络的目标检测算法中,设计合理的多尺度特征融合模块对多尺度目标检测非常重要,多尺度特征决定网络具备图像中不同尺度目标进行定位与辨识,特征金字塔可融合出高语义细粒度特征,实现多尺度精准检测的目标。

基于特征金字塔的目标检测方法可以分为基于图像特征融合和基于图像特征精炼的目标检测方法,其中,基于特征精炼的目标检测过程中首先将骨干网络提取的多尺度特征直接融合得到单一尺度特征,再对该特征进行不同尺度的采样分离出相同的特征图,然而由于特征金字塔顶层与底层特征存在较大差距,精炼后采样分离出的特征图依旧未对齐且特征信息损失。

基于特征融合的目标检测将高语义分类特征用于增强底层定位特征,使底层特征同样具有高语义分析信息,提高了检测的精度。例如申请公布号为CN 110084124 A,名称为“基于特征金字塔网络的特征增强目标检测方法”的专利申请,公开了一种基于特征金字塔网络的图像目标检测方法,该方法首先建立基于深度学习神经网络的骨干网络,将骨干网络在ImageNet的分类数据集上进行预训练;然后将待检测图像送入建立的骨干网络提取特征,得到各层特征;在前两步建立的金字塔特征网络模型的基础上增加自顶向下模块、自底向上模块、融合扩展模块;其次对三个模块得到的特征金字塔相同尺寸的对应层特征进行按通道方向做连接操作;最后将对应层特征分别送入目标检测器中。该方法提升了对多尺度目标的检测精度,参数和计算量少。但其存在的不足之处在于,该方法仅考虑图像特征金字塔不同层间相同通道的关系,没有考虑不同层的相同通道特征图所代表的语义特征与上下文属性经过非线性变换发生了改变,从而导致不同层语义特征信息不具备一致性,进而导致多尺度目标的检测精度较低。

发明内容

本发明目的在于针对上述现有技术的不足,提出了一种基于语义特征一致性金字塔网络的图像目标检测方法,用于解决现有技术中存在的因为图像或视频目标检测过程中目标多尺度语义特征融合时不一致导致的检测精度较低的技术问题。

为实现上述目的,本发明采取的技术方案包括如下步骤:

(1)获取训练样本集K和测试样本集V:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011458846.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top