[发明专利]一种基于复杂背景图像的三维模型跨域检索方法及系统在审
申请号: | 202010417173.9 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111625667A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 李海生;杜雨佳;李勇;姚春莲;李楠 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/583;G06F16/538;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 背景 图像 三维 模型 检索 方法 系统 | ||
1.一种基于复杂背景图像的三维模型跨域检索方法,其特征在于,所述方法包括如下步骤:
步骤1)构建原始数据集D,所述原始数据集包括若干不同的三维模型M与具有复杂背景的图像I,所述原始数据集D以三元组T=(IA,Mpos,Mneg)表示,其中IA表示作为Anchor的图像,Mpos表示与所述图像IA同类的正类三维模型,Mneg表示与所述图像IA异类的反类三维模型;
步骤2)对所述三元组T中的所述图像IA进行预处理得到处理后的图像I′A,对所述三元组T中的所述正类三维模型Mpos与所述反类三维模型Mneg分别进行投影处理得到所述正类三维模型投影视图组Vpos与所述反类三维模型投影视图组Vneg,再分别进行预处理得到处理后的正类三维模型投影视图组V′pos与反类三维模型投影视图组V′neg,得到处理后的三元组T′=(I′A,V′pos,V′neg)表示的标准数据集D′;
步骤3)针对所述处理后的三元组T′,构建跨域检索三元组深度网络模型N,所述跨域检索三元组深度网络包含3个分支网络,分别为1个图像精确特征提取网络NI与结构相同、权值共享的2个三维模型分组视图特征提取网络NM,其中所述图像精确特征提取网络NI的输入为所述处理后的三元组T′中的所述处理后的图像I′A,输出为图像特征向量所述三维模型分组视图特征提取网络NM的输入分别为所述处理后的三元组T′中的所述处理后的正类三维模型投影视图组V′pos与反类三维模型投影视图组V′neg,输出分别为正类三维模型特征向量与反类三维模型特征向量
所述图像精确特征提取网络为包含注意力块的AlexNet网络,所述网络包含5个卷积层和3个全连接层,所述注意力块位于每两个前后连接的卷积层之间,由1个通道注意力模块和1个空间注意力模块串联组成;
所述三维模型分组视图特征提取网络以AlexNet网络的卷积结构为基础网络并包含分组子网络,所述三维模型分组视图特征提取网络包含AlexNet网络的全部卷积层共5个,在最后1个所述卷积层后连接所述分组子网络,在最后1个所述卷积层输出视图特征向量后,所述分组子网络将所述视图特征向量融合为组级特征向量、再将所述组级特征向量融合为形状级特征向量、最后将所述形状级特征向量融合为所述三维模型特征向量并输出;
步骤4)对所述图像特征向量所述正类三维模型特征向量与所述反类三维模型特征向量进行正则化处理,得到所述正则化后的图像特征向量所述正类三维模型特征向量与所述反类三维模型特征向量定义所述跨域检索三元组深度网络模型N的损失函数L;
步骤5)使用所述处理后的三元组T′,迭代训练跨域检索三元组深度网络模型N的参数,直至所述损失函数L小于设定阈值停止训练,得到已训练的跨域检索三元组深度网络模型N′,完成所述图像IA与所述三维模型M的特征联合嵌入空间构建,所述已训练的跨域检索三元组深度网络模型N′包含3个已训练的分支网络,分别为一个已训练的图像精确特征提取网络N′I与两个已训练的三维模型分组视图特征提取网络N′M;
步骤6)执行检索任务时,给定查询图像q与目标三维模型集S,对所述查询数据q进行所述预处理得到处理后的查询图像q′,对所述目标三维数据集S中的每个目标三维模型Si进行所述投影处理得到所述三维模型投影视图组SVi,再进行所述预处理得到处理后的三维模型投影视图组SV′i,将所述处理后的查询图像q′输入已训练的图像精确特征提取网络N′I中,输出得到所述查询图像q对应的图像特征向量Fq,进行正则化处理后得到正则化后的图像特征向量F′q,将所述处理后的投影视图组SV′i输入已训练的三维模型分组视图特征提取网络N′M中,输出得到目标三维模型Si对应的三维模型特征向量进行正则化处理后得到正则化后的三维模型特征向量计算所述正则化后的图像特征向量F′q与所述正则化后的三维模型特征向量之间的距离D(q,Si),以所述距离D(q,Si)衡量所述查询图像q与每个所述目标三维模型Si之间的相似度并降序排序,选择若干排序靠前的目标三维模型Stop作为与所述查询图像q相似的检索结果并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010417173.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医用物资的线上查询方法和系统
- 下一篇:一种温度熔断器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序