[发明专利]一种基于全局上下文感知的遥感图像目标检测方法在审
申请号: | 202210126106.0 | 申请日: | 2022-02-10 |
公开(公告)号: | CN114519819A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 张科;吴虞霖;王靖宇;苏雨;张烨;李浩宇;谭明虎 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/32;G06N3/04;G06N3/08 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 上下文 感知 遥感 图像 目标 检测 方法 | ||
本发明公开了一种基于全局上下文感知的遥感图像目标检测方法,使用深度残差网络(ResNet 101)提取图像的特征,利用特征金字塔网络(FPN,Feature Pyramid Network)进一步提取特征并生成候选区域;生成候选区域后,使用特征池化对齐特征;在特征提取网络的最高层加入全局上下文提取模块,提取特征与原始特征通过相加的方式融合,得到新的特征;最后利用全连接层对新特征进行分类,生成目标类别及边框。本发明利用高层特征语义信息丰富的特点,充分提取图像的场景信息,进一步加强特征表示,增加对密集目标的识别准确率,也一定程度上提高了其他目标的识别准确率,从而整体提高遥感图像中的目标检测性能。
技术领域
本发明属于模式识别技术领域,具体涉及一种遥感图像目标检测方法。
背景技术
遥感图像分析一直是计算机视觉领域研究的热点,在城市规划、土地利用管理、环境监测等领域得到了广泛的应用。目标检测是计算机视觉领域的基础任务,可以为后续的事件检测、目标跟踪、人机交互、场景分割等任务提供支持。遥感图像通常是从高空拍摄的,由于机载或者星载传感器的不同,拍摄角度和拍摄高度均不固定。与自然图像相比,遥感图像中的场景信息更加丰富,目标类别多,排列密集,因此,遥感图像目标检测面临着很大的挑战。由于存在上述问题,尽管针对遥感图像目标检测已经提出了一些算法,但是性能仍有提升空间,因此遥感图像目标检测依然是目前研究的热点问题之一。
史文旭(《特征增强SSD算法及其在遥感目标检测中的应用》,光子学报,2020,49(01):154-163.)为了提高对复杂场景下多尺度遥感目标的检测精度,提出了基于多尺度单发射击检测的特征增强目标检测算法。该方法通过设计浅层特征增强模块,提高网络对小目标特征提取能力;设计深层特征增强模块,替换SSD金字塔特征层中的深层网络。但是该方法没有充分利用遥感图像中丰富的场景信息,提升效果有限。
原有的FPN检测算法对于遥感图像中的密集目标检测效果较差,这是因为在特征金字塔网络中,缺乏充分的场景信息。密集目标的检测需要依赖场景信息,例如汽车只会出现在停车场或道路上,汽车的周围一般都是汽车。因此缺乏对场景信息即全局上下文的感知,导致网络难以识别密集目标。
发明内容
为了克服现有技术的不足,本发明提供了一种基于全局上下文感知的遥感图像目标检测方法,使用深度残差网络(ResNet 101)提取图像的特征,利用特征金字塔网络(FPN,Feature Pyramid Network)进一步提取特征并生成候选区域;生成候选区域后,使用特征池化对齐特征;在特征提取网络的最高层加入全局上下文提取模块,提取特征与原始特征通过相加的方式融合,得到新的特征;最后利用全连接层对新特征进行分类,生成目标类别及边框。本发明利用高层特征语义信息丰富的特点,充分提取图像的场景信息,进一步加强特征表示,增加对密集目标的识别准确率,也一定程度上提高了其他目标的识别准确率,从而整体提高遥感图像中的目标检测性能。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:预处理和划分数据集;
将标准数据集中的已标注图像统一裁剪为多幅1024*1024的图像,裁剪时宽度和高度分别保留10%像素的重合率,再随机划分为训练集、验证集和测试集,训练集、验证集和测试集没有交集;
步骤2:构造目标检测深度神经网络并采用梯度下降和反向传播算法训练目标检测深度神经网络;所述目标检测深度神经网络先采用Res101残差网络提取特征,再使用特征金字塔网络FPN生成候选区域,然后对候选区域进行局部上下文感知,最后经过特征池化和全连接层得到目标类别和边界框,具体如下:
步骤2-1:使用预训练模型初始化Res101模型参数;
步骤2-2:将1024*1024的图像输入Res101残差网络提取特征后,生成5种不同大小的特征图,记为C1~C6,尺度分别为512*512,256*256,128*128,64*64,32*32,16*16;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210126106.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:贴片式采集装置及生理参数采集系统
- 下一篇:音量控制方法、装置、设备及介质