[发明专利]一种基于多模态融合的三维模型检索方法在审
申请号: | 202011292371.3 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112270762A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 褚晶辉;郑博文;聂为之 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T17/20 | 分类号: | G06T17/20;G06N3/04 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多模态 融合 三维 模型 检索 方法 | ||
1.一种基于多模态融合的三维模型检索方法,其特征在于,所述方法包括:
1)对旋转后的三维模型使用蝴蝶细分算法进行表面细分,并从三维模型中提取出点云数据;
2)对旋转后的三维模型使用OpenGL工具,以30度角间隔对三维模型进行12个视角的视图渲染,获得12张多视图图像;
3)对旋转后的三维模型从xyz三个坐标轴方向上将三维模型投影到一个圆柱体表面,在每个坐标轴上分别获取4张全景视图,分别是三维模型空间分布图像、三维模型法线偏差图像、法线偏差图的梯度信息图像、上述三通道的堆叠图像,最后共可获得12张全景视图图像;
4)将点云数据输入PointNet网络,将12张多视图图像输入MVCNN训练网络,将12张全景视图图像输入另一个MVCNN预训练网络;
5)使用加入了关联损失和实例损失的损失函数对三个网络进行联合训练;
6)将训练好的三个网络的输出特征向量进行统计加权融合,使用融合后的特征向量作为三维模型的最终特征向量,以用于后续的三维模型检索中。
2.根据权利要求1所述的一种基于多模态融合的三维模型检索方法,其特征在于,所述方法在步骤1)之前还包括:获取旋转后的三维模型的步骤,具体为:
给定一个三维模型,计算它的质心并进行平移,使得质心与坐标原点重合;
对处理后的三维模型计算协方差矩阵,通过矩阵特征分解获得一组特征向量和特征值,对特征值进行降序排序并选择前三个特征向量作为新的主轴方向,获得一个旋转矩阵,通过旋转矩阵对三维模型进行旋转。
3.根据权利要求1所述的一种基于多模态融合的三维模型检索方法,其特征在于,所述步骤5)具体为:
将点云数据输入到PointNet网络中,将多视图模态数据、全景视图模态数据分别输入到不同的MVCNN深度网络中;
使用改造后的损失函数对网络进行联合训练,其中改造后的损失函数由判别损失、关联损失、实例损失三部分构成;
其中,代表模态M1的判别损失,和分别代表M1与模态M2和M3的关联损失,代表实例损失。
4.根据权利要求3所述的一种基于多模态融合的三维模型检索方法,其特征在于,所述关联损失具体为:
其中,f表示不同模态的特征向量,M表示模态,不同的下标表示不同的模态,ξ=sigmoid(log(abs(.)),ξ用于归一化特征向量,sigmoid函数为机器学习的神经元激励函数,abs(.)表示求绝对值。
5.根据权利要求3所述的一种基于多模态融合的三维模型检索方法,其特征在于,所述实例损失具体为:
其中,
为特征向量分类为模型xi的概率,α=1,2,3。
6.根据权利要求1所述的一种基于多模态融合的三维模型检索方法,其特征在于,所述将训练好的三个网络的输出特征向量进行统计加权融合具体为:
其中,γi代表不同模态的权重,为对应模态下的特征向量,不同的下标i表示来自同一个三维模型的不同模态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011292371.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种尺寸规格可调的取暖器面板
- 下一篇:一种农业大数据价格预警管理系统及方法