[发明专利]一种基于人工智能的产品三维展示方法及装置在审
申请号: | 201810406212.8 | 申请日: | 2018-04-30 |
公开(公告)号: | CN108765549A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 程昔恩;杜姗姗 | 申请(专利权)人: | 程昔恩 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06T15/00;G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 333000 江西省景德*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维图像 三维展示 渲染 人工智能 视频 人工神经网络 人工智能技术 信息处理技术 三维CAD模型 便携设备 模型生成 视点信息 学习训练 有效解决 拍摄 低成本 数据集 再利用 真实感 建模 手机 视点 图像 | ||
1.一种基于人工智能的产品三维展示方法,其特征在于,所述基于人工智能的产品三维展示方法包括:
通过人工神经网络建模三维图像渲染模型,接着根据人工智能的学习训练方法利用数据集对所述三维图像渲染模型进行一次训练,然后再利用用户拍摄的某一产品的视频或图像对三维图像渲染模型进行二次训练,最终获得针对该产品的三维图像渲染模型。
2.如权利要求1所述基于人工智能的产品三维展示方法,其特征在于,所述基于人工智能的产品三维展示方法具体包括:
步骤一、构建人工神经网络近似建模的三维图像渲染模型;
步骤二、利用三维图像渲染模型及三维图像渲染模型对应图像构成的训练数据集以人工智能的学习训练方法对所述三维图像渲染模型进行训练,获取经过一次训练的三维图像渲染模型;
步骤三、获取用户围绕产品拍摄的视频或图像;
步骤四、利用当前产品的图像数据对所述的一次训练的三维图像渲染模型进行二次训练,获取产品调优的三维图像渲染模型;
步骤五、获取用户请求的任意视点信息,将之输入三维图像渲染模型,获取所述产品在当前视点的三维图像。
3.如权利要求2所述基于人工智能的产品三维展示方法,其特征在于,
在步骤一中,使用包含多种隐层的组合架构的人工神经网络来近似建模三维图像渲染模型;
三维图像渲染模型包括第一输入层、第一卷积层组、第二输入层、第一上采样层组、第一残差网络块组、第二上采样层组、第一输出层、第三输入层、第二卷积层组、第二残差网络块组、第三上采样层组、第二输出层;以与请求视点相关的视点图像作为三维图像渲染模型的第一输入层并以请求视点信息作为三维图像渲染模型的第二输入层,所述第一输入层输入数据经过所述第一卷积层组处理后,与所述第二输入层输入数据经第一上采样层处理后的数据共同经所述第一残差网络块组处理,并经所述第二上采样层组处理后在所述第一输出层获得输出结果;以第一输出层的输出结果的融合结果作为第三输入层,所述第三输入层输入数据经所述第二卷积层组、所述第二残差网络块组、所述第三上采样层组处理后,在所述第三输出层获得输出结果,第三输出层的输出结果为三维图像渲染模型的输出数据。
4.如权利要求2所述基于人工智能的产品三维展示方法,其特征在于,在步骤二中, 利用ShapeNet构建的数据集,为:
其中,表示给定模型在任一视点下的三维图像,表示指定的视点信息,表示给定模型在视点下的三维图像,表示由给定模型在视点下距离视点虚拟相机的距离信息构成的深度图,表示图像的像素在图像中的可见性,表示数据集中训练样本的个数;
在步骤二中,通过学习训练获取一次训练的三维图像渲染模型的学习训练过程在将三维图像渲染模型按网络架构分成两个子网络:第一子网络和第二子网络,首先通过人工智能的学习训练方法训练第一子网络,接着训练第二子网络,最后对整个网络进行联合调优;
在步骤二中,通过训练获取三维图像渲染模型的第一子网络的训练过程在于通过人工智能的学习训练使得第一子网络的的输出数据能最小化第一损失函数;
第一损失函数如下:
其中,第一子网络的输入是 ,表示第一子网络输出的图像,表示第一子网络输出的深度信息,表示第一子网络输出的图像的像素在图像中的可见性, 是定义损失项权重的常数系数;
在步骤二中,通过训练获取三维图像渲染模型的第二子网络的训练过程在于通过人工智能的学习训练使得第二子网络的的输出数据能最小化第二损失函数;
所述第二损失函数如下:
其中,表示所述第二子网络的输入数据,表示所述第二子网络的输出数据,由图像判别模型定义,为使得图像判别模型能区分输入是给定视角信息下的产品训练图像,为使第二子网络输出数据能够欺骗图像判别模型,为使第二子网络的输出数据的图像特征和给定视角信息下的产品训练图像的图像特征一致, 表示在图像判别模型的第层提取图像特征;
所述图像判别模型由卷积神经网络近似建模,所述图像判别模型包括输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、全连接层,以训练样本中的产品三维图像或第二子网络的输出数据作为输入,所述输入经过所述输入层、所述第一卷积层、所述第二卷积层、所述第三卷积层、所述第四卷积层、所述全连接层后输出数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于程昔恩,未经程昔恩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810406212.8/1.html,转载请声明来源钻瓜专利网。