[发明专利]一种基于两步可切换归一化深度神经网络的图像匹配方法有效
申请号: | 202010293080.X | 申请日: | 2020-04-15 |
公开(公告)号: | CN111488938B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 肖国宝;钟振;曾坤 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/776;G06V10/82;G06N3/04;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 两步可 切换 归一化 深度 神经网络 图像 匹配 方法 | ||
1.一种基于两步可切换归一化深度神经网络的图像匹配方法,其特征在于:
包括以下步骤:
步骤S1:数据集处理:提供一图像对(I,I'),使用基于黑塞映射的检测子分别从每个图像中提取特征点kpi,kp′i;则图像I的信息提取的特征点集为KP={kpi}i∈N;从图像I′获得特征点集KP′={kp′i}i∈N;每个对应关系(kpi,kp′i)能生成4D数据:
D=[d1;d2;d3;.......; dN],di=[xi,yi,x′i,y′i]
D表示图像对的匹配组即输入数据,di表示匹配对,(xi,yi),(x′i,y′i)表示匹配中两个特征点的坐标;
步骤S2:特征增强:使用一个卷积核大小为1×1的卷积层将步骤S1处理后的4D数据映射为一个32维的特征向量,即D(1×N×4)→D(1×N×32),用以减少网络特征学习带来的信息损失;其中,N为一张图片提取的特征点个数;
步骤S3:使用残差网络对增强后的特征即映射后的特征向量进行特征提取,并用两步稀疏可切换归一化代替批归一化,用以更鲁棒的提取增强数据的全局特征,并输出初步预测结果;
步骤S4:在测试阶段,将残差网络的输出设为初步预测结果,并且使用激活函数tanh和relu对初步预测结果进行处理,即,fx=relu(tanh(xout)),得到预测值为0或1,其中,0表示错误匹配,1表示正确匹配的最终结果;在整个网络的训练中,采用交叉熵损失函数来指导网络的学习;如公式所示:
其中,yi表示第i个匹配的真实值,y'i表示第i个匹配的预测值;
所述步骤S3具体包括以下内容:
两步稀疏可切换归一化分为两层:第一层为上下文归一化,第二层为可切换归一化;上下文归一化为每个数据镶嵌全局上下文信息,给定输入数据xi,在第l层,上下文归一化定义如下:
其中,表示上下文归一化的输出结果;ul和ol分别代表l网络层数据的平均值和标准差;
上下文归一化将全局信息嵌入到每个特征点数据中;在第二层归一化中使用了微分前馈稀疏学习算法从批归一化、实例归一化和层归一化选择最合适归一化,用以减少固定归一化对最终结果的影响;可切换归一化定义如下:
其中表示第二归一化层的输出结果;λ和β分别代表比例和位移参数;|ψ|表示由三个归一化组成的集合;uj和分别表示其相应网络层数据的平均值和方差,j=1,2,3分别表示在三个归一化{LN,BN,IN}的位置索引;rj和r′j分别表示其相应网络层数据平均值和方差的比例参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010293080.X/1.html,转载请声明来源钻瓜专利网。