[发明专利]基于多特征融合的建筑物识别方法有效
申请号: | 201810840821.4 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109034066B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 张永梅;马健喆;付昊天;冯超;张奕 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/44;G06V10/50;G06V10/764;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 融合 建筑物 识别 方法 | ||
1.一种基于多特征融合的建筑物识别方法,其特征在于,包括:
步骤1,对输入的多光谱图像提取Gabor-HOG特征,包括:利用Gabor滤波器提取建筑物的多尺度特征和多方向的纹理全局特征,形成Gabor特征图,然后提取建筑物的HoG特征,具体步骤包括:
(1)图像预处理
利用48个Gabor滤波器进行Gabor特征提取,所述Gabor滤波器具有6个尺度和8个方向;对图像采用Gabor滤波器进行卷积后,提取到图像的Gabor纹理特征;
采用最大线性嵌入方法进行降维,对每个特征图所有像素在同一尺度下不同方向进行编码,编码方式如公式(1)、(2)、(3)和(4)所示;
公式(3)的是指在原尺度Gabor特征图在v方向上的虚部编码,公式(4)的表示在原尺度Gabor特征图在v方向上的实部编码;是编码后的实部值,是编码后的虚部值;编码之后的实部和虚部的表示范围为[0,255],即为灰度图像特征;
对6个不同尺度特征进行融合,通过对其对应编码的十进制数求平均值的方法,将不同尺度的特征图融为一体,平均值融合方式的计算公式如公式(5)和(6)所示;
(2)按照公式(7)计算输入图像每个像素点的梯度值,水平方向梯度和垂直方向梯度的算子分别采用算子[-1,0,1]和[-1,0,1]T;
(3)将分块的直方图进行投影
设置子图cell大小为8*8,并设置9个bin用于统计每个cell的梯度信息;将4个相邻的cell组成一个block,进行归一化处理,并生成每个block的HOG特征,此时每个block的HOG特征维度为4*9=36维;
(4)将所有block的HOG特征,通过滑动窗口方式进行向量化,滑动窗口大小选择10*10,得到整幅图像的Gabor-HOG特征;
步骤2,将提取的Gabor-HOG特征与图像RGB颜色特征进行融合,形成低层特征向量,包括:
在提取的Gabor-HOG特征中加入原图像每个像素点的R、G、B值,形成特征向量;
步骤3,将低层特征向量输入到训练好的深度置信网络模型中,提取建筑物的高层特征,并生成每个像素点的后验概率;
对深度置信网络模型进行训练:
采用K-对比散度算法对单个RBM进行训练;
利用醒-睡算法对上下参数进行调优,其中:
醒算法的具体步骤如下:
(1)输入训练数据(x,y);
(2)对hki进行Gibbs采样:
(3)对δk-1进行Gibbs采样:
(4)得出可视层的激活概率:
(5)梯度方向更新权值和偏置:
bk,i←bk,i+η(hki-δk)
aj←aj+η(vj-p(vj=1|h1));
(6)输出生成的权值gk,偏置bk和a;
得到权值后,通过睡算法根据训练标签对权值进行更新,睡算法的具体步骤如下:
(1)输入训练数据(x,y);
(2)对δri进行Gibbs采样:
(3)对δr-1,i进行Gibbs采样:
对y进行Gibbs采样:
y~p(y=ei|δr)=softmax(wr+1δr+br+1)
对δri进行Gibbs采样:
(4)对δk-1,i进行Gibbs采样:
(5)计算每个隐含层的激活概率j:
(6)对所有的权值和偏置更新:
(7)输出识别权值wk与偏置bk、联想记忆权值wr和br、标签的权值wr+1和br+1,其中1≤k≤r-1;
步骤4,将生成的每个像素点的后验概率输入到训练好的条件随机场模型中,提取每个像素点邻域信息的上下文特征,并根据最大后验概率识别建筑物目标;
所述识别建筑物目标的具体方法如下:对于给定的一幅图像,y是其观测数据,y={yi},yi是第i幅图像的位置,又有x={xi},x是图像中的位置标记,令xi只取0或1,分别代表建筑物和非建筑物;
对目标分别求其后验概率,在已知观测值的条件下,其标签集的后验概率的等价形式如公式(8)所示;
P(y|x)∝P(x|y)P(y) (8)
P(y|x)表示某幅图像的后验概率,P(y)是观测集的先验概率,P(x|y)为给定类别的条件概率分布;在CRF模型中,后验概率表示成Gibbs分布,其形式如公式(9)所示;
Z(x,θ)是用于归一化的分配函数,只考虑一元簇和成对簇,则观测值分布独立,改写为公式(10)的形式;
在公式(10)中,θ=(θμ,θτ)是CRF模型参数,通过训练得到,函数μ(x)是在已知θμ情况下,此像素输入建筑物或非建筑物的可能性;τ(x)表示已知参数θτ所提供的上下文信息,表示该像素的分类结果受到其邻域内像素的影响;
采用基于最大似然估计的方法迭代求解出参数θ=(θμ,θτ):
假设训练数据中,给定T={xi,yi},K,N代表其中的一组样本,样本之间不存在关联,是训练集中(x,y)的经验概率,则对于条件概率p(y|x,θ),T的似然函数定义如公式(11)所示,通过似然函数估计出θ,使得U(θ)得到最大值,即公式(12);
θMaxU=arg maxθL(θ) (12)
对该公式(11)两边取对数,得到新的似然函数L(θ)′,其定义如公式(13)所示;该CRF模型的条件概率模型如公式(14)所示;
公式中的θ={η1,η2,...,ηn,λ1,λ2,...,λn}即所需估计的参数;将公式(13)带入公式(12)中,得到本模型下的最大似然函数,该函数如公式(15)所示;
公式(15)中的函数I(x)是向上取整函数,η是(η1,η2,...,ηm)的简写形式,λ是(λ1,λ2,...,λm)的简写形式,g是向量(g1(yi,x),g2(yi,x),...,gK(yi,x))的简写形式,f是向量(f1(yi-1,x),f2(yi-1,x),...,fK(yi-1,x))的缩写;
在θ空间内,θ的最优解可在对其每个参数分量的偏导数为0处取到;对于λk求偏导得到公式(16)的形式;令公式(16)等于0,即可求出参数λ;以同样的方法求出参数η;
通过最大似然法求得参数θ后,即完成了模型训练;此时通过模型求出每个像素的上下文信息,并根据计算的概率推测出给定的一幅测试图像中像素是否属于建筑物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810840821.4/1.html,转载请声明来源钻瓜专利网。