[发明专利]基于CRBM和Fisher网络的移动视觉搜索框架在审
申请号: | 201711493995.X | 申请日: | 2017-12-31 |
公开(公告)号: | CN108108770A | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 纪荣嵘;林贤明;黄晨 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;H04N1/32 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 局部特征 全局特征 图像检索 网络构建 移动视觉 自适应 算法 聚合 紧凑 搜索 受限玻尔兹曼机 图像特征信息 非高斯分布 一致性检验 自适应算法 标量量化 检索阶段 特征算法 特征信息 网络带宽 网络结构 选择传输 粗匹配 候选集 移动端 子空间 匹配 网络 移动 全局 | ||
1.基于CRBM和Fisher网络的移动视觉搜索框架,其特征在于包括以下步骤:
1)连续受限玻尔兹曼机网络构建与训练;
2)Fisher layer网络构建与训练。
2.如权利要求1所述基于CRBM和Fisher网络的移动视觉搜索框架,其特征在于在步骤1)中,所述连续受限玻尔兹曼机网络构建与训练的具体方法如下:
(1)构建方法:构建3层连续受限玻尔兹曼机网络,第一层包含128个单元,第二层包含64个单元,第三层包含32个单元;前一层单元为可视单元,后一层单元为隐藏单元;可视单元和隐藏单元通过全连接相连,连接权重为{w};连续受限玻尔兹曼机在RBM网络中的可视层sigmoid函数中添加一个均值为0的高斯噪声连续随机单元,其结构与RBM一样,包括一个可视层与一个隐层,层间单元相互连接,在网络进行训练以及使用时信息会在两个方向上流动,且两个方向的权值是相同的,即w
其中
N
(2)训练方法:
采用最小化对比散度权重更新算法来训练CRBM网络参数,只需进行简单的加法和乘法运算;MCD训练准则更新权值{ω
其中,
简化后的a
(3)监督微调:
CRBM使用对比散度算法后获得的权值已经迫近全局最优解,采用反向传播算法进行微调;期望输出目标{V′
其中,x是网络输入数据值,F
l=L-1,...,2的各层,各层中的第i个神经元节点的残差为:
f(z
对于l=L-1,...,2的各层,连接权值参数、偏置参数、斜率控制参数的偏导数分别为:
其中:
h
z
s
所求梯度是在数据集中单个样本进行的梯度更新,对于整个数据集训练,只要将每个梯度相加求平均梯度即可;求出所有参数的梯度值之后,使用拟牛顿优化算法对每个参数进行优化。
3.如权利要求1所述基于CRBM和Fisher网络的移动视觉搜索框架,其特征在于在步骤2)中,所述Fisher layer网络构建与训练的具体方法如下:
将混合高斯模型进行两点简化,假设:
(1)假设GMM中每个高斯函数权重相等,即ω
(2)简化u
相当于假设协方差矩阵具有相同的行列式值;简化后γ
假设w
其中,⊙为元素运算;γ
经过简化后的Fisher Vector算法为线性运算,因此网络训练可以用梯度下降法,采用误差反向传播的方式计算误差函数对全部权值和偏置值的梯度;CDVS主要解决的是大规模图像检索和图片匹配问题,在大规模图像检索问题中,自适应全局二值特征作用于检索流程的第一阶段,用全局特征在服务器端的数据库中进行汉明距离匹配,获得候选集,选择交叉商损失函数:
其中,s
σ(x)=1/(1+exp(-x))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711493995.X/1.html,转载请声明来源钻瓜专利网。