[发明专利]一种基于目标空间知识和两阶段预测学习的目标检测方法有效
申请号: | 201711059887.1 | 申请日: | 2017-11-01 |
公开(公告)号: | CN107871119B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 侯彪;任仲乐;焦李成;朱浩;赵暐;刘旭;孙其功;马文萍 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710065 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 空间 知识 阶段 预测 学习 检测 方法 | ||
1.一种基于目标空间知识和两阶段预测学习的目标检测方法,其特征在于,利用数据变换的方法增大样本的数目、增加样本的多样性,训练SSD和RefineNet两个深层神经网络;对SSD初步预测结果中概率较大的预测目标通过RefineNet进一步提升判别的准确性;通过制定目标特有的空间结构约束规则减少错误的预测,进一步提升检测结果,利用深层网络的特征学习能力,结合目标空间结构先验的约束,实现多类遥感目标的准确检测,包括以下步骤:
S1、输入高分辨光学遥感图像,将图像有重叠地分割成适合网络尺寸的像块,划分训练集和测试集,并对训练集通过各种变换实现数据扩充;
S2、将训练集送入SSD网络训练直至达到设置的终止条件,具体如下:
输入整幅图像到SSD模型,先通过ImageNet数据集上预训练好的VGG16网络模型对整幅图像提取深层特征,再添加6个新的卷积神经网络CNN层,每个CNN设定不同的尺度,确定尺度参数sk及整个模型的损失函数,最后根据每个特征图坐标点上设计好的目标提取框提取特征,并用特征预测目标的类别和边界框;
确定尺度参数sk的公式如下:
其中,k∈[1,m],m为特征图个数,尺度参数的最小值smin=0.2,最大值smax=0.9;
整个模型的损失函数如下:
其中,Lconf(x,c)表示目标的识别性能,Lloc(x,l,g)表示预测目标边界框的定位性能,α表示识别性能与定位性能的平衡因子,x表示设计的目标提取框中是否包含对应的目标,N表示匹配框的数量,c表示目标的真实概率,l和g分别表示预测框和真实框的位置向量;
模型训练过程中,初始学习率为4×10-5,动量项为0.9,权重惩罚项为0.0005,最小批量为32,最大迭代次数为120000,优化方式为随机梯度下降SGD,NMS阈值为0.45,目标区域交并比IoU为0.5;
S3、选取训练集中各类目标样本送入RefineNet网络训练直至达到设置的终止条件,从训练集中依据给定的标准框抽取包含目标部分的像块和对应的类别标签,放缩至128×128尺寸后送入RefineNet网络进行训练,设置初始学习率为1×10-3;动量项为0.9;权重惩罚项为0.0005;最小批量为64;最大迭代次数50000;优化方式为SGD;
S4、将测试图像送入训练好的SSD网络得到初步的预测结果,再通过置信度阈值滤掉可能性极小的候选目标,保留大概率候选目标;
S5、截取包含大概率候选目标的预测框,放缩至合适尺寸,送入训练好的RefineNet网络得到进一步的类别和置信度判定;
S6、制定各类遥感目标的空间约束规则,滤除错误预测,并结合两次预测的置信度给出最终预测的置信度,通过非极大值抑制NMS和置信度阈值筛选得到最终预测的类别、概率和定位结果;
S7、在原高分辨光学遥感图像上可视化预测结果并计算检测率与虚警率。
2.根据权利要求1所述的一种基于目标空间知识和两阶段预测学习的目标检测方法,其特征在于,步骤S1具体为:
首先将单通道的图像通过复制转化为三通道的图像,对每幅高分辨大场景的光学遥感图像,有重叠地划分300×300的像块,间隔步长为200;
然后选择有真实标记的80%目标作为训练集,其余20%目标作为测试集,并通过旋转、镜像、对比度增强的方法扩充样本的数目;
再以0.5的概率随机调整光度参数、放缩原图像尺寸采块以增加样本的多样性,使训练样本数量和变化种类更好地满足深层网络的训练要求,同时对采块的原图像占比、长宽比范围、目标交叠比也做出限制;
最后通过减去计算得到的所有图像的强度均值,获得最终的训练集和测试集;
各种变换和约束的具体参数如下:
旋转角度:0°,90°,180°,270°;镜像:左右翻转;对比度增强:直方图均衡化;亮度变换因子:δ=32;对比度变化范围:[0.5,1.5];色度变换因子:δ=18;饱和度变化范围:[0.5,1.5];膨胀尺寸范围:[1,4];占原图像比例范围:[0.3,1];长宽比范围:[0.5,2];与目标的重叠比阈值:0.1,0.3,0.5,0.7,0.9,1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711059887.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数学教育用教学板
- 下一篇:一种具有空气净化功能的黑板