[发明专利]一种基于全局上下文感知的遥感图像目标检测方法在审
申请号: | 202210126106.0 | 申请日: | 2022-02-10 |
公开(公告)号: | CN114519819A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 张科;吴虞霖;王靖宇;苏雨;张烨;李浩宇;谭明虎 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/32;G06N3/04;G06N3/08 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 上下文 感知 遥感 图像 目标 检测 方法 | ||
1.一种基于全局上下文感知的遥感图像目标检测方法,其特征在于,包括以下步骤:
步骤1:预处理和划分数据集;
将标准数据集中的已标注图像统一裁剪为多幅1024*1024的图像,裁剪时宽度和高度分别保留10%像素的重合率,再随机划分为训练集、验证集和测试集,训练集、验证集和测试集没有交集;
步骤2:构造目标检测深度神经网络并采用梯度下降和反向传播算法训练目标检测深度神经网络;所述目标检测深度神经网络先采用Res101残差网络提取特征,再使用特征金字塔网络FPN生成候选区域,然后对候选区域进行局部上下文感知,最后经过特征池化和全连接层得到目标类别和边界框,具体如下:
步骤2-1:使用预训练模型初始化Res101模型参数;
步骤2-2:将1024*1024的图像输入Res101残差网络提取特征后,生成5种不同大小的特征图,记为C1~C6,尺度分别为512*512,256*256,128*128,64*64,32*32,16*16;
步骤2-3:对特征图C6进行全局最大池化,得到含有场景信息的场景特征;将场景特征再经过一个10*10卷积和一个1*1卷积,得到全局特征;
步骤2-4:将特征图C5作为特征金字塔的特征图P5;
将特征图C5经过上采样,与经过1*1卷积的特征图C4相加,生成特征金字塔的特征图P4;
将特征图C4经过上采样,与经过1*1卷积的特征图C3相加,生成特征金字塔的特征图P3;
将特征图C3经过上采样,与经过1*1卷积的特征图C2相加,生成特征金字塔的特征图P2;
步骤2-5:特征金字塔的特征图P2、P3、P4、P5的尺寸分别为2562、1282、642、322;使用区域生成网络对特征金字塔中的每张特征图生成锚点anchor,每个anchor对应的宽高比包括1:2、1:1和2:1三种;因此,特征金字塔生成15种不同的anchor;
使用anchor生成目标候选区域,计算公式为:
其中,(xc,yc)为anchor点坐标,(w,h)分别为目标候选区域的宽度和高度,(x1,y1)和(x2,y2)为目标候选区域的左上角和右下角坐标;
计算目标候选区域和真实标签的交并比IoU:如果IoU≥0.7,则将目标候选区域设为正样本;如果IoU0.3,则将目标候选区域设为负样本;将得到的正样本和负样本作为训练目标候选区域的标签;
步骤2-6:对目标候选区域进行特征池化,采用式(2)计算目标候选区域经过特征池化后对应的特征层:
其中,1024指输入图像尺寸,k0为基准值;
因为目标候选区域是从四种不同的特征图P2、P3、P4、P5上经过anchor生成的,所以特征池化后也对应4种不同的特征层;
特征池化后4种不同的特征层的取值规则为:
特征图P2、P3、P4、P5中的目标候选区域经过特征池化后,每个目标候选区域分别输出7*7个结果,即提取出49个特征;
步骤2-7:把步骤2-6得到的49个特征和步骤2-3得到的全局特征相加,依次输入两个全连接层,两个全连接层输出结果为目标类别和目标边界框;
步骤3:将待检测遥感图像输入训练完成的目标检测深度神经网络,输出得到目标的类别边界框。
2.根据权利要求1所述的一种基于全局上下文感知的遥感图像目标检测方法,其特征在于,所述k0=4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210126106.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:贴片式采集装置及生理参数采集系统
- 下一篇:音量控制方法、装置、设备及介质