[发明专利]一种图像语义特征约束的遥感目标检测方法有效

专利信息
申请号: 202011018965.5 申请日: 2020-09-24
公开(公告)号: CN112101277B 公开(公告)日: 2023-07-28
发明(设计)人: 孙斌;马付严;李树涛;孙俊 申请(专利权)人: 湖南大学;富士通株式会社
主分类号: G06V20/13 分类号: G06V20/13;G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08
代理公司: 湖南兆弘专利事务所(普通合伙) 43008 代理人: 谭武艺
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 语义 特征 约束 遥感 目标 检测 方法
【说明书】:

发明公开了一种图像语义特征约束的遥感目标检测方法,本发明方法包括:采用深度残差网络ResNet50和特征金字塔网络对输入图像进行特征提取,并融合得到多尺度的特征图输入中心估计模块,将中心估计模块输出、输入结合得到过滤掉负样本的图像语义特征图;利用提取到的图像语义特征约束任意方向锚点的生成,并通过旋转候选区域生成网络,在过滤掉负样本后的图像语义特征图中提取候选区域,通过旋转兴趣区域聚集层,为每个候选区域提取出大小统一的特征向量;分别利用两个全连接层分支完成分类和回归任务,得到输入的遥感图像中各个候选区域的检测结果和检测位置。本发明极大减少了计算成本,并提高了检测速度和检测准确率。

技术领域

本发明涉及图像目标检测方法,具体涉及一种图像语义特征约束的遥感目标检测方法。

背景技术

智能运输和对地观测的需求导致了遥感图像车辆检测大受关注。它旨在识别车辆的类别,并在遥感图像中准确定位每辆车辆。尽管已经为解决该任务付出了许多努力,但是由于遥感图像中的车辆的各种尺寸和外观,车辆检测仍然非常具有挑战性。特别地,检测具有任意方向的车辆也使其成为极其困难的任务,因为直接应用水平物体检测方法经常会导致感兴趣区域(RoIs)和车辆区域不匹配,从而极大地扩大了搜索空间。

Shaoqing Ren等发表的《Faster R-CNN:Towards real-time object detectionwith region proposal networks》(in Advances in Neural Information ProcessingSystems,2015,pp.91–99.)记载通过预设不同大小、不同长宽比的锚点(或初始估计的物体边框),并基于预设的锚点回归图像中的物体位置的方式,在开放基准测试中被证明是有效的。任意方向目标检测方法大多也采用同种策略,以Jianqi Ma等发表的《Arbitrary-oriented scene text detection via rotation proposals》(IEEE Transactions onMultimedia,vol.20,no.11,pp.3111–3122,2018.)记载的旋转候选区域生成网络为例,它利用具有角度的锚点生成旋转候选区域(或候选边框的集合),再以旋转候选区域为基础回归并细化它们的位置。这种基于锚点的检测算法的检测性能较好,但这类算法通常起始于大量且分布密集的锚点,在算法模型训练阶段计算真值边框与预测边框的交并比,去除交并比小于阈值的预测边框负样本,会产生大量的计算成本。Kaiwen Duan等发表的《Centernet:Keypoint triplets for object detection》(in Proceedings of the IEEEInternational Conference on Computer Vision,2019,pp.6569–6578.)、Hei Law andJia Deng发表的《Cornernet:Detecting objects as paired keypoints》(inProceedings of the European Conference on Computer Vision,2018,pp.734–750.)记载的无锚检测方法通过关键点而不是具有预定大小和长宽比的锚来预测边框。但是,由于仅将关键点用于预测边框,因此与基于锚点的检测方法相比,无锚检测方法的召回率较低。

发明内容

本发明要解决的技术问题:针对现有技术的上述问题,提供一种图像语义特征约束的遥感目标检测方法,利用图像中的语义特征信息约束锚点的产生,本发明极大减少了计算成本,并提高了检测速度和检测准确率。

为了解决上述技术问题,本发明采用的技术方案为:

一种图像语义特征约束的遥感目标检测方法,其特征在于,包括以下步骤:

步骤1):采用深度残差网络ResNet50和特征金字塔网络对输入图像进行特征提取,并进行融合得到融合多尺度信息的多尺度的特征图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学;富士通株式会社,未经湖南大学;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011018965.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top