[发明专利]一种快速稠密的图像匹配方法及系统在审
申请号: | 202110452168.6 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113033708A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 郑健青;黄保茹 | 申请(专利权)人: | 郑健青 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 上海京沪专利代理事务所(普通合伙) 31235 | 代理人: | 沈美英 |
地址: | 200331 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 稠密 图像 匹配 方法 系统 | ||
本发明涉及一种快速稠密的图像匹配方法及系统,特征在于通过指定的若干搜索区域的局部匹配,并利用低分辨率下得到的匹配结果对被匹配图像进行重采样,从而能够通过滑动窗口限定后续更高分辨率匹配过程的搜索范围,实现高分辨率图像之间快速稠密的全局匹配,同时也降低了匹配过程中的时间、空间复杂度;另外通过引入基于坐标表达的匹配结果,在建立匹配关系的同时也保留图像本身拓扑信息,使匹配过程更具连续性和可靠的物理意义,能够利用先验信息如参数化坐标变换对匹配过程正则化精细化;并且该方法中能够加入可训练参数实现自适应优化和拓展成为泛用性模型。
技术领域
本发明涉及图像数据采集技术领域,特别是一种快速稠密的图像匹配方法及系统。
背景技术
近年来,科技水平日益提高,形成了全球自动化的格局,随之而来的人工智能技术蓬勃发展,其主要目的是令机器联合计算机像人类一样感知、理解与行动。视觉感知作为最主要的感知技术之一,在此次人工智能热潮下占据着举足轻重的地位,因而推动着计算机视觉技术迅猛发展。同时,如何理解多个视觉目标之间的区别与联系,并根据特定的需求对感知的信息作相应的处理已然成为整个计算机视觉领域的研究热点之一,而图像匹配作为其中的一个基础而关键的任务,连接着具有相同或相似属性的两个图像目标,是低层视觉通往高层视觉的纽带,是实现信息识别与整合以及从低维图像恢复高维结构的有效途径。
图像匹配是一项基础的视觉处理技术,对图像的每个像素或区域进行特征提取,并查找对应关系,是众多视觉任务的首要步骤,如图像检索(ImageRetrival)、图像拼接(Image Mosaic)、多模图像融合(Multimodal Image Fusion)、图像配准(ImageRegistration)、相机位姿估计(Camera Pose Estimation)、视觉里程计(VisualOdometry)、三维重建(3DReconstruction)、运动恢复结构(Structure from Motion)、即时定位与地图构建(Simultaneous Localization and Mapping)等。据美国自动成像协会(Automated Imaging Association)统计,40%以上的视觉感知应用依赖于图像特征匹配的精度与效率,包括计算机视觉、模式识别、遥感、军事安防、医学诊断与手术导航等各个领域。
图像匹配精度匹配导致的误差会在后续处理环节中逐渐累积从而严重制约最终视觉任务的有效实施,因此在许多基于匹配的精准估计应用上有着极高的要求。通常模板图像通常来自不同时间、不同视角和不同传感器,成像条件多样性不可避免地造成了图像的匹配难度,况且图像本身的局部形变或畸变,以及图像之间的复杂变换等因素同样对特征匹配问题造成了严重阻碍。除此之外,如何减少因噪声、畸变、重复图像内容以及遮挡等问题造成的错误匹配也是特征匹配中亟需解决的问题。另一方面,图像匹配的稠密度会直接影响后续视觉任务,如基于立体匹配的三维重建中的结构细节,然而图像特征匹配问题本质上是一个复杂组合优化难题,稠密特征点的匹配过程通常需要特征数量的平方计算复杂度,况且离群点和噪声的引入将大大增加问题的求解难度,因而在建模求解过程中,如何减少解的搜索空间,降低问题的计算复杂度也是特征匹配的重要难题。
图像匹配方法包括图像特征提取及特征匹配,其中传统特征匹配方法如随机样本一致性(RanSaC)算法需要迭代运算,而在稠密特征点情况时会严重增加时间成本,因此通常针对稀疏特征点进行匹配。深度学习通常可以实现快速的特征点匹配,但是受限于高分辨率大范围搜索空间所带来的计算成本,现有的深度学习方法也无法实现存在大幅度或非参数化坐标变换的两个图像之间的快速稠密匹配。
一些匹配方法利用参数化坐标变换、观测物体、场景、拍摄过程的先验条件来限制搜索范围,如专利CN102654902利用不同尺度图像金字塔由上向下传递的平移旋转信息实现快速匹配;如2018年ECCV会议所收录的MVSNet采用的代价体(Cost Volume)实现立体匹配,不仅需要基于单应性的相机标定还限制了视差范围;如专利CN201180057099.3同样基于立体视图投影中的单应性关系来限制搜索范围。但是这些先验信息的获取同样增加了成本或限制了使用场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑健青,未经郑健青许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110452168.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序