[发明专利]一种基于端到端神经网络的多路图片拼接方法有效
申请号: | 202010553739.0 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111709880B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 张世明 | 申请(专利权)人: | 贝格迈思(深圳)技术有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/50 |
代理公司: | 深圳泛航知识产权代理事务所(普通合伙) 44867 | 代理人: | 邓爱军 |
地址: | 518000 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 端到端 神经网络 图片 拼接 方法 | ||
1.一种基于端到端神经网络的多路图片拼接方法,其特征在于,系统包括以下步骤:
S1:通过相邻邻接图估计器预估计多图像间的邻接关系,通过自适应卷积神经网络CNN计算两两图像间的单应性矩阵,并确定二者之间是否邻接,并确定二者之间的邻接权重,通过确定两两图片间的邻接权重,构建多图像间的邻接图G(I,E,δ);
S2:根据多图像间的邻接图G(I,E,δ),确定最优基平面图像Iopt,并基于最优基平面图像Iopt选取所有与其邻接的图像{Ilink};其中,与最优基平面图像I1邻接图像为{Ilink}={I2,I3,I5,I6,I7};将Iopt和{Ilink}输入自适应网格流单应性估计器,计算获得基于网格的多单应性矩阵{Hopt-link};
其中,自适应单应性估计器,为基于卷积神经网络CNN单应性估计器;
S3:通过多单应性矩阵{Hopt-link},将最优基平面图像Iopt邻接的所有图像{Ilink}投影到最优基平面Iopt,实现图像拼接融合;
获得拼接融合后的图像I'=Iopt+{Hmesh}{Ilink};
若,多图像邻接权重图中的所有图像均被处理,则输出I'为最终拼接图;
若,剩余未处理图像,则I'为当前最优基平面图像Iopt,并回到S2处理。
2.根据权利要求1所述的基于端到端神经网络的多路图片拼接方法,其特征在于,算法流程包括以下步骤:
S21:过相邻邻接图估计器,拼接两两图像:
通过简洁CNN网络特征抽取器f(x)抽取任意两两图像Ii和Ij的特征Fi=f(Ii)和Fi=f(Ij);
利用CNN网络特征抽取器的子CNN网络,估计每个特征相应的特征权重矩阵Wi=w(Ii)和Wj=w(Ij),表征每个特征向量为该图像关键特征点的概率;
通过图像Ii的特征Fi和权重Wi,计算图像Ii的合成特征FiWi,并输入复杂的单应性估计CNN网络,再同过同过程计算图像Ij的合成特征FjWj;通过CNN网络估计图像Ii和Ij,并以Ii为基平面计算得到的单应性矩阵Hij=h(Ii,Ij);变换单应性矩阵Hij;
将图像Ij投影到Ii基平面的图像,I'j=Warp(Ii,Hij)=HijIj;
合并Ii和I'j,即得拼接图像Ii+Ij;
其中,通过输入FiWi和FjWj自适应训练单应性矩阵Hij=h(Ii,Ij),需要基于局部损失函数Ln(Ii,Ij),收敛以获得最优单应性矩阵Hij;
其中,局部损失函数Ln(Ii,Ij)定义如下:
Ln(Ii,Ij)=|WiFi-WjF'j|-|WiFi-WjFj|=|WiFi-WjHijFj|-|WiFi-WjFj|;
图像Ii与Ij的全局损失函数定义如下:
L(Ii,Ij)=Ln(Ii,Ij)+Ln(Ij,Ii)+|HijHji-1|+Ln(Ii,I'j)+Ln(Ij,I'i)+|H'ijH'ji-1|;
全局损失函数最小化时的单应性矩阵Hij为最优单应性矩阵:
其中,I为相应单位矩阵;
S22:多图像邻接权重图;根据S21计算任意两两图像的最优单应性矩阵和相应的全局损失函数L(Ii,Ij),以此损失函数为权重δ=L(Ii,Ij)构建权重图:
其中,如果不存在,即证明图像Ii和Ij不重叠,设δ为正无穷大;图像Ii整体权重定义为所有与其相邻的图像{Ilink}i的权重之和,即:
S23:定选取基平面图像,计算当前所有图像整体权重,并确定具有最小整体权重的图像为基平面图像,并设定Iopt为:
S24:获取Iopt对应的所有邻接图像集合{Ilink}opt;
S25:判断{Ilink}opt是否为空;
若为空,则说明当前与Iopt重叠的图像已经拼接完成,多图像拼接算法输出最终拼接图像;
若不为空,则将Iopt和{Ilink}opt输入到自适应网格流单应性估计器,进行自适应网格流单应性拼接;
S26:通过自适应网格流单应性器计算获得以Iopt为基平面,获得每个与Iopt相邻的图像Ij的网格流最优单应性矩阵
其中,自适应网格流单应性器是基于网格流的CNN单应性估计器;
S27:获得通过变换器拼接图像Iopt和{Ilink}opt,即:
S28:以I'为新图像合并相邻邻接图,形成新的相邻邻接图;
计算G'(I,E,δ)=G(I,E,δ)-Iopt-{Ilink}opt;
判断G'(I,E,δ)是否为空:
若为空,则图像拼接完成,输出最终拼接图像;
若不为空,基于G'(I,E,δ)UI';
返回至S23,重复S23-S28,直到G'(I,E,δ)为空;
S29:输出最终拼接图像集合{I'},算法完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝格迈思(深圳)技术有限公司,未经贝格迈思(深圳)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010553739.0/1.html,转载请声明来源钻瓜专利网。