[发明专利]一种基于改进的推土距离的混合高斯模型匹配方法有效
申请号: | 201610589709.9 | 申请日: | 2016-07-26 |
公开(公告)号: | CN106250918B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 李培华;王旗龙;郝华 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/64 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种适用于图像分类和图像检索的算法系统。该算法主要包括图像建模和图像匹配两个模块。在图像建模中,为了提高特征的描述能力,该算法首次利用深层卷积神经网络提取图像的深度特征,并在此基础上利用混合高斯模型建模表示图像。在图像匹配中,针对推土距离算法的效率以及对噪声敏感两个问题,提出了一种准确高效的改进的推土距离算法,在算法设计过程中加入了高斯噪声并引入了稀疏约束。同时,在设计改进的推土距离算法中,针对现有测地距离度量算法设计的缺陷,本发明在考虑了高斯分布的黎曼几何结构后设计了三种测地距离,用以更准确地度量高斯分布之间的距离。 | ||
搜索关键词: | 一种 基于 改进 距离 混合 模型 匹配 方法 | ||
【主权项】:
1.一种基于改进的推土距离的混合高斯模型匹配方法,其特征在于以下步骤:步骤1:提取图像的深层卷积神经网络特征;将图像与已训练好的卷积神经网络CNN进行卷积运算,将网络的最后一层卷积层输出作为图像的卷积神经网络特征;步骤2:混合高斯模型建模图像;利用GMM描述图像的深层卷积神经网络特征在特征空间的分布,每幅图像由1个含有多个单高斯分布的GMM模型表示;所述的利用深层卷积神经网络特征建模混合高斯模型,具体过程如下:首先,利用已经训练好的19层的VGG‑VD网络提取图像的深层卷积神经网络特征,对于一幅图像的特征,用含有n个单高斯的混合高斯模型G表示;其中,N(X|μi,∑i)表示权重为ωi的第i个单高斯,μi,∑i分别表示第i个单高斯的均值向量和协方差矩阵;步骤3:利用改进的推土距离算法计算图像之间的距离,通过步骤2,图像之间的距离转化为了GMM模型之间的距离,利用改进的推土距离算法计算GMM之间的距离;在改进的推土距离算法计算过程中,利用一种改进的高斯嵌入距离度量两个高斯分布之间的距离;步骤4:计算相似性矩阵;通过第3步,计算所有图像之间的距离,构成距离矩阵;步骤5:图像匹配并返回结果;对于图像分类问题,将第4步得到的相似性矩阵送入核化的支持向量机Kernel SVM中进行分类;对于图像检索问题,利用步骤4计算得到的距离矩阵,返回与被检索图像距离最小的N幅图片,所述利用改进的推土距离算法计算图像之间的距离,具体过程如下:对于图像I1和I2,它们的GMM分别为和表示高斯分布和之间的测地距离;EMD算法的表达式为:其中,d12是一个n1n2维的向量,向量中的元素为两个混合高斯模型中高斯分布与之间的测地距离A12是一个元素为0或1的(n1+n2)×(n1n2)的系数矩阵;是由混合高斯模型中各个高斯分布的权重组成的向量;上述推土距离算法利用单纯形算法求解;由于在推土距离算法在保证收敛到最优解f12时,f12中的非0元素个数少于(n1+n2)/(n1n2),所以f12天然地具有稀疏的特性;同时,在考虑噪声影响的情况下,推土距离算法的约束条件调整为A12f12=W+ν12,其中ν12是0均值的高斯噪声;令D12f12=C,其中D12是对角元素为d12的对角阵,所以有改进的推土距离算法写为:其中,A,W与EMD算法中的表示一致,分别是系数矩阵和权重向量;D是一个对角元素为高斯分布之间的测地距离的对角矩阵,λ>0是一个常数的正则项,控制算法的稀疏性;||·||2和||·||1分别表示二范数和一范数;由于两个高斯分布之间的距离可能为0,为了能够计算矩阵D的逆,在D的每一个对角元素上加了一个很小的值;其次,在改进的推土距离算法中度量高斯分布之间的测地距离时,由于高斯分布不仅具有概率统计的特性,同时也是一个黎曼流形,采用下述方法用于度量两个高斯分布之间的距离;高斯分布的空间是一个黎曼流形,并且可以嵌入到对称正定SPD矩阵中;令N(0,I)表示一个均值为0,协方差矩阵为单位阵的k维高斯分布;如果随机向量x服从N(0,I),那么它的仿射变换Qx+μ服从N(μ,∑),其中,∑可以分解为∑=QTQ,|Q|>0,|·|表示矩阵的行列式;于是,高斯分布可以通过仿射变换(μ,Q)表示;令τ1表示从仿射群Q∈Rk×k,|Q|>0}到一般线性群S={S|S∈R(k+1)×(k+1),|S|>0};τ2表示从一般线性群S到对称正定SPD矩阵P=PT,|P|>0}的映射,即:其中,CQ=|Q|‑1(k+1);通过公式(4)中的两个映射,一个k维的高斯分布N(μ,∑)就可以嵌入到SPD矩阵空间中,并且由一个(k+1)×(k+1)的SPD矩阵唯一地表示,即:由于在嵌入过程中,均值向量μ与协方差矩阵∑的量级相差较大,所以改进的高斯嵌入距离在嵌入过程中引入了均衡参数γ:由于SPD矩阵空间是一个李群且形成了一个黎曼流形,Log‑欧式算法常用来度量此空间内的距离,在这样的度量框架下具有线性空间结构,的李代数Sn是一个线性空间,矩阵的指数映射exp:是一一对应平滑的等距映射,这使得在Sn上的操作等于在上的操作;两个SPD矩阵P1,P2的测地距离为:d(P1,P2)=||log(P1)‑log(P2)||F (7)其中,log表示矩阵的对数运算,||·||F表示矩阵的F‑范数;由此计算得到度量高斯分布间的测地距离方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610589709.9/,转载请声明来源钻瓜专利网。