[发明专利]影像对应判断方法及装置有效
申请号: | 201810545843.8 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108985319B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 林政宪;卓柏全;杨宏毅 | 申请(专利权)人: | 宏达国际电子股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 黄艳 |
地址: | 中国台湾桃*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 影像 对应 判断 方法 装置 | ||
一种影像对应判断方法,包括:串接第一影像以及第二影像,以产生具有全域信息的串接影像;自串接影像获取多个特征,以产生多个特征图并将特征图分为多个第一特征图以及多个第二特征图;自第一特征图中获取对应第一区域的多个第一影像区块以及自第二特征图中获取对应第二区域的多个第二影像区块;串接第一影像区块以及第二影像区块,以产生多个串接影像区块;以及根据串接影像区块计算相似度度量,以判断第一区域以及第二区域间的相似度。本发明的影像对应判断方法及装置简化神经网络系统的结构,并将全域信息纳入考量。
技术领域
本发明涉及影像处理技术,且特别涉及一种影像对应判断方法及装置。
背景技术
影像对应判断技术可在两个影像中辨识对应的区域。虽然现在的技术对于固定且具纹理的物体可具有良好的判断表现,但是对于影像中非固定以及较不具纹理的区域来说,则很难进行辨识。学习的特征描述子(feature descriptor)对于例如,但不限于视角、亮度、变形或是较差的纹理来说,较不具有识别性。
因此,如何设计一个新的影像对应判断方法及装置,以解决上述的缺失,乃为此一业界亟待解决的问题。
发明内容
本发明的目的在于通过影像对应判断方法及装置,达到简化神经网络系统的结构,并将全域信息纳入考量的技术效果。
因此,本发明的一实施方式是在提供一种影像对应(image correspondence)判断方法,用以通过由影像对应判断装置实现的神经网络(neural network)系统执行影像对应判断,影像对应判断方法包括:由神经网络系统的第一串接(concatenating)单元串接第一影像以及第二影像,以产生具有全域信息的串接影像;由神经网络系统的卷积神经网络(convolutional neural network;CNN)单元自串接影像获取多个特征,以产生多个特征图(feature map)并将特征图分为多个第一特征图以及多个第二特征图;由神经网络系统的影像区块获取单元自第一特征图中获取对应第一区域的多个第一影像区块以及自第二特征图中获取对应第二区域的多个第二影像区块;由神经网络系统的第二串接单元串接第一影像区块以及第二影像区块,以产生多个串接影像区块;以及由神经网络系统的度量学习(metric learning)网络单元根据串接影像区块计算相似度度量,以判断第一区域以及第二区域间的相似度。
在本发明的一实施例中,卷积神经网络单元包含多个卷积神经网络层,配置以根据多个学习权重运行。
在本发明的一实施例中,第一影像、第二影像、第一特征图以及第二特征图具有相同的宽度以及相同的高度。
在本发明的一实施例中,第一影像以及第二影像具有相同的深度,且串接影像的总深度相当于第一影像以及第二影像的深度的总和。
在本发明的一实施例中,第一特征图、第二特征图、第一影像区块以及所述多个第二影像区块具有相同的一深度,且所述多个串接影像区块的一总深度相当于所述多个第一影像区块以及所述多个第二影像区块的一深度的总和。
在本发明的一实施例中,全域信息包含跨越第一影像以及第二影像的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏达国际电子股份有限公司,未经宏达国际电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810545843.8/2.html,转载请声明来源钻瓜专利网。