[发明专利]多模态融合生成虚拟服装方法、装置、设备及存储介质有效
申请号: | 202210613785.4 | 申请日: | 2022-06-01 |
公开(公告)号: | CN114723843B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 张绪杰;黄成文;梁小丹 | 申请(专利权)人: | 广东时谛智能科技有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06V10/26;G06V10/74;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06F40/284 |
代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
地址: | 510308 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多模态 融合 生成 虚拟 服装 方法 装置 设备 存储 介质 | ||
本申请公开了一种多模态融合生成虚拟服装方法、装置、设备及存储介质。本申请通过确定样本服装图像的各个语义块与样本文本序列的各个词汇的对应关系,并根据该对应关系将服装的原图编码和文本编码进行融合,并根据融合后的编码优化特征编码本,以使特征编码本融合服装细节图像特征和对应描述文本特征,生成多模态特征编码。通过特征编码本获取草稿编码图、局部图编码和文本编码转换成对应的多模态特征编码,并通过多模态特征编码训练基于注意力机制的图像预测模型,以便通过注意力预测模型将多个多模态特征编码进行融合以预测服装的图像。通过上述技术手段,关注虚拟服装的细节,优化虚拟服装的视觉效果。
技术领域
本申请涉及虚拟服装生成技术领域,尤其涉及一种多模态融合生成虚拟服装方法、装置、设备及存储介质。
背景技术
在服装设计领域,跨模态服装设计方法基于注意力机制跨模态融合多种模态的服装信息生成对应的服装图片,进而快速设计出满足服装信息的虚拟服装,具备巨大的开发潜力与应用前景。
现有的跨模态服装设计方法,在第一阶段使用矢量量化变分自编码器通过将输入图像压缩成一个低分辨率离散特征映射,然后重构输入图像,学习真实图像中各个视觉部分的局部特征编码本。在第二阶段,将各种服装信息输入基于注意力机制的神经网络,预测合成图像的序列,从第一阶段的学习得到的特征编码本中采样得到序列值。基于注意力机制的神经网络的全局表现力将不同模态的服装信息统一表示,以在单个模型内处理任意类型的跨模态服装信息,并生成符合大多数情况下的合理结果。由于特征编码本中只编码了服装的局部视觉特征,而忽略了服装的文本信息,而文本信息可以提供更多的区别性特征,这导致模型了出现低级表示和粗糙语义,而忽略了服装的细节,生成的虚拟服装的视觉效果差。
发明内容
本申请提供一种多模态融合生成虚拟服装方法、装置、设备及存储介质,解决了现有技术中的注意力机制学习的特征编码本只编码了服装的图像特征而忽略了服装的文本信息的问题,开创性建立了服装细节图像和描述文本的对应关系,利用该对应关系构建出语义丰富且关注服装细节的特征编码本,利用该特征编码本获取关注服装细节的多模态特征编码,通过多模态特征编码预测出更加高清更有细节的虚拟图像,优化虚拟服装的视觉效果。
第一方面,本申请提供了一种多模态融合生成虚拟服装方法,包括:
获取样本服装图像对应的语义分割图和样本文本序列,根据所述语义分割图的语义图像编码和所述样本文本序列的文本编码,确定所述语义分割图中各个语义块对应的所述样本文本序列中的词汇;
将所述样本服装图像输入预设的第一编码器,得到所述第一编码器输出的原图编码,根据所述语义块与对应的词汇,将所述原图编码与所述文本编码进行融合,并将融合的编码离散成多个一维编码;
根据所述一维编码和预设的特征编码本中各个样本编码的距离值,优化所述一维编码和所述特征编码本,通过预设的解码器对优化后的一维编码进行解码得到复原图像,根据所述复原图像和所述样本服装图像优化所述解码器和所述第一编码器;
获取所述样本服装图像对应的样本草稿图像和样本局部图像,根据优化好的特征编码本将所述样本草稿图像的草稿图编码、所述样本局部图像的局部图编码和所述文本编码分别转换为第一样本编码、第二样本编码和第三样本编码;
将所述第一样本编码、所述第二样本编码和所述第三样本编码输入预设的注意力预测模型,得到所述注意力预测模型输出的预测编码,根据所述预测编码和所述原图编码优化所述注意力预测模型。
第二方面,本申请提供了一种多模态融合生成虚拟服装装置,包括:
关系确定模块,被配置为获取样本服装图像对应的语义分割图和样本文本序列,根据所述语义分割图的语义图像编码和所述样本文本序列的文本编码,确定所述语义分割图中各个语义块对应的所述样本文本序列中的词汇;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东时谛智能科技有限公司,未经广东时谛智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210613785.4/2.html,转载请声明来源钻瓜专利网。