[发明专利]基于深度学习的多尺度图像配准方法和装置在审

申请号：	202010524717.1	申请日：	2020-06-10
公开（公告）号：	CN111709980A	公开（公告）日：	2020-09-25
发明（设计）人：	边丽蘅;彭林涛;张军	申请（专利权）人：	北京理工大学
主分类号：	G06T7/33	分类号：	G06T7/33;G06N3/04;G06N3/08
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	石茵汀
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度学习尺度图像方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提出一种基于深度学习的多尺度图像配准方法和装置。其中，方法包括：获取第一待配准图像和第二待配准图像，通过预设多层卷积神经网络架构分别对第一待配准图像和第二待配准图像进行特征提取处理；获取目标中间层输出的第一特征描述符和第二特征描述符，根据第一特征描述符和第二特征描述符计算第一待配准图像和第二待配准图像的特征点距离矩阵；根据特征点距离矩阵对第一待配准图像和第二待配准图像进行双向特征点匹配得到特征点匹配对；根据特征点匹配对第一待配准图像和第二待配准图像进行图像配准。由此，能够在快速完成图像配准的前提下，具有非常好的尺度适应性，同时对旋转，光照，平移等变换具有较好的适应性。

技术领域

本申请涉及计算机视觉和深度学习领域，特别涉及基于深度学习的多尺度图像配准方法和装置。

背景技术

图像配准将两幅或多幅拍摄于不同时间、不同视角等多种变化的图像进行对齐，继而确定图像间空间位置、强度等之间的映射关系。它是图像处理领域的关键技术，在图像融合、图像拼接以及计算机视觉等方面发挥重要作用。

相关图像配准方法主要分为三类：基于特征的配准方法、基于变换域的配准方法和基于灰度信息的配准方法。基于特征的方法计算速度快且对灰度变化和图像形变等都有较好的适应能力，克服了其它两种方法的不足，是如今图像配准研究领域的热门方法。基于特征的图像配准的步骤主要包括以下四步：手动或自动的特征提取；两幅待配准图像进行特征匹配；估计图像变换模型的参数；统一坐标变换进行图像配准。其中特征提取和特征匹配在整个配准过程是非常关键的。点特征是基于特征的图像配准方法中最常用到的特征之一，特征点提取方法有Moravec提出的Mo～角点检测算法、Chris Harris和Mike Stephens提出的Harris角点检测算法、Mokhtarian和Suomela提出的CSS特征检测算法等，但这些算法对旋转及尺度变化的适应性较差。

尺度不变特征变化的特征点提取方法以优越的图像细节描述能力和较好的稳定性在图像配准算法中有着广泛的应用。David G.Lowe提出了SIFT算法，此算法是基于高斯尺度空间的特征点提取算法，所提取的特征点具有尺度和旋转不变性，是目前公认的最为稳定的算子，并于2004年对该算法进行了深入的发展和完善。Krystian Mikolajczyk和Cord-elia Schmid提出了仿射和尺度不变性的harris角点检测并且证明了该算法相较于其他尺度空间的特征提取算法有更高的重复率。张小洪利用多分辨的思想，结合小波变换的灰度强度变化公式，提出了基于小波变换的harris角点检测，该算法克服了单一尺度的harris角点可能存在角点丢失等问题并且具有尺度不变性。Bay等人对SIFT算法进行了改进，采用了han特征以及积分图像的概念，加快了计算速度。许多学者结合不同特征提取和匹配方法提出了各种图像配准方法，Wang Weixing等人用Harris-Laplace算子进行特征提取，用SURF算法进行特征描述并用欧氏距离进行匹配，此算法的优点在于完成了自动图像配准，提高了配准精度且减少了时间。许佳佳结合Harris与SIFF算法进行角点检测，再用随机kd树算法进行特征匹配，从而完成图像配准，该方法保证特征点的尺度不变性且相较于SIFT算法减少了图像配准的时间，但在特征点提取时加大了计算复杂性。

近几年，也有很多研究人员将深度学习应用到图像配准过程中。2014年，Dosovitskiy等人提出了一种通用的特征提取方法，使用未标记的数据训练卷积神经网络。这些特征的通用性使转换具有鲁棒性。这些特征或描述符的性能优于SIFT描述符以匹配任务。2018年，Yang等人开发了一种基于相同思想的非刚性配准方法。他们使用预训练的VGG网络层来生成一个特征描述符，同时保留卷积信息和局部特征。这些描述符的性能也优于类似SIFT的探测器，特别是在SIFT包含许多异常值或无法匹配足够数量特征点的情况下。在2016年，DeTone等人发表了Deep Image Homography Estimation，提出了HomographyNe回归网络，这是一种VGG风格模型，可以学习两幅相关图像的单应性。该算法具有以端到端的方式同时学习单应性和CNN模型参数的优势，不需要前两个阶段的过程。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010524717.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种针对高铁枕梁工艺孔的焊枪自动轨迹避让方法
下一篇：一种多单管半导体激光器双面冷却封装结构

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的多尺度图像配准方法和装置在审

专利文献下载