[发明专利]一种遥感图像多类目标检测和识别方法有效
申请号: | 201210300645.8 | 申请日: | 2012-08-22 |
公开(公告)号: | CN102867195A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 韩军伟;周培诚;王东阳;郭雷;程塨;李晖晖 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于稀疏表示字典学习的遥感图像多类目标检测和识别的方法。技术特征在于:首先对预处理后的训练数据使用基于稀疏表示字典训练方法训练出字典;然后对测试图像中的子图像块使用训练所得到的字典进行稀疏编码,求出其稀疏表示系数进而得出子图像块的重构误差,通过对重构误差的阈值化处理,确定候选目标区域;最后经过后期处理实现对遥感图像多类目标的精确检测和识别。利用本发明方法,可以从复杂背景下的遥感图像中检测并识别出多种类型的目标。本发明具有较高的检测识别精度和较低的虚警率。 | ||
搜索关键词: | 一种 遥感 图像 类目 检测 识别 方法 | ||
【主权项】:
1.一种遥感图像多类目标检测和识别方法,其设计步骤如下:步骤1:使用基于稀疏表示字典学习的方法训练字典,具体步骤如下:步骤a1训练图像前期处理:首先将原始图像中的同类别目标统一到一个主方向,然后将统一方向后的图像沿着0°到360°、按照步长
旋转为
个不同方向的图像;将不同类别目标的原始图像都按照上述方法处理,得到
类训练图像,其中p为所要检测的不同类别目标数,
为旋转角度,c是所得到的训练图像中不同目标不同方向图像的类别总个数;其中:
为向下取整;步骤b1数据预处理:采用加权平均法对
类训练图像的RGB三个分量进行加权平均得到灰度图像,然后对灰度图像进行下采样处理,得到n×n大小的图像;对n×n大小的图像进行能量归一化处理得到归一化图像,再将归一化图像转换为n2×1维的列向量,将列向量作为训练数据中的一列,得到预处理后的训练数据集U=[U1,U2,…,Uc],其中U1是训练数据集U中对应第i类的子数据集,i=1,2,…,c;步骤c1训练字典:通过Fisher Discrimination Dictionary Learning for Sparse Representation发布的FDDL软件包训练已知训练数据集U=[U1,U2,..,Uc],得到字典D=[D1,D2,…,Dc],其中,Di是与第i类相对应的子字典;步骤2稀疏编码:根据训练所得到的字典D=[D1,D2,…,Dc],对测试图像中的每个子图像块进行稀疏编码,求出每个子图像块对应的稀疏系数,具体处理步骤如下:步骤a2测试图像预处理:首先使用步骤b1中所述的加权平均法将测试图像转化为测试灰度图像,然后使用大小为S×S的滑动窗口沿着测试灰度图像以间隔步长b滑动得到子图像块;将子图像块下采样处理到大小为n×n的图像,然后进行能量归一化处理,再将能量归一化处理后的图像转换为一个n2×1维的列向量β,用列向量β来表示通过滑动窗口所得到的子图像块的像素灰度值信息;步骤b2稀疏编码:对每个子图像块通过优化模型α ^ = arg min | | α | | 1 s . t . | | β - Dα | | 2 2 ≤ ϵ ]]> 得到对应每个子图像块的稀疏编码系数
其中
是与子字典Di所对应的系数向量,ε>0是容许误差,||·||1为l1范数,||·||2为l2范数;步骤c2求取重构误差:根据稀疏编码系数
计算每个子图像块与每一类的重构误差ei,取e=min{ei}作为此子图像块的重构误差,并记录其所对应的类别
然后根据重构误差e与预先设定的阈值τ之间的大小关系来判定此子图像块中是否包含目标:如果e<τ,说明包含目标,否则,说明此子图像块为背景;步骤3目标检测与识别:步骤a3:将步骤c2中判定包含目标的每个子图像块所对应的重构误差e,组成一个与测试灰度图像大小一致的、表示候选目标区域的重构误差矩阵E=(est)P×Q;其中,est为重构误差矩阵在坐标点(s,t)处的值,e st = 0 e ≥ τ e e < τ , ]]> P×Q为测试图像的大小,s=1,2,…P,t=1,2,…Q;将步骤c2中判定包含目标的每个子图像块所对应的类别C,组成一个与测试灰度图像大小一致的、表示候选目标类别的类别矩阵L=(Cst)P×Q;其中Cst为类别矩阵在坐标点(s,t)处的值,C st = 0 e ≥ τ C e < τ ; ]]> 步骤b3:改变滑窗S×S的大小G次,重复步骤2~步骤a3G次,得到的G个重构误差矩阵和G个类别矩阵,G的取值范围为5~10;将得到的G个重构误差矩阵组成一个多尺度重构误差矩阵MAP=(estg)P×Q×G;其中,estg为矩阵MAP中的元素,其值为第g次改变滑窗大小得到的重构误差矩阵所对应的est,P×Q×G为多尺度重构误差矩阵的大小,g=1,2,…G;将得到的G个类别矩阵构成一个多尺度类别矩阵CLASS=(Cstg)P×Q×G;其中,Cstg为矩阵CLASS中的元素,其值为第g次改变滑窗大小得到的类别矩阵所对应的Cst;根据多尺度重构误差矩阵MAP得到一个最小重构误差矩阵(map(s,t))P×Q,其中map(s,t)为对应最小重构误差矩阵在坐标点(s,t)处的值,
然后求出对应最小重构误差矩阵的最小类别矩阵(class(s,t))P×Q,其中class(s,t)为最小类别矩阵在坐标点(s,t)处的值,
根据多尺度重构误差矩阵MAP求出尺度矩阵scale=(scale(s,t))P×Q,scale(s,t)为对应尺度矩阵在坐标点(r,t)处的值,scale ( s , t ) = 0 e st = 0 arg min g { e stg } e st ≠ 0 ; ]]> 步骤c3:求取最小重构误差矩阵(map(s,t))P×Q的局部邻域极小值作为检测到的目标响应值,局部邻域极小值在最小重构误差矩阵(map(s,t))P×Q中所对应的坐标即为目标的中心位置,根据中心位置在(class(s,t))P×Q和(scale(s,t))P×Q中对应的位置找到目标所对应的类别及尺度大小。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210300645.8/,转载请声明来源钻瓜专利网。
- 上一篇:电机轴花键端旋变调零工装
- 下一篇:专用滑环拔出器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序