[发明专利]跨媒体检索及模型训练方法、装置、设备、菜谱检索系统有效
申请号: | 202211432939.6 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115658955B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 赵雅倩;王立;范宝余 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/901;G06N3/0442;G06N3/0464;G06N3/084;G06V10/80 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张志梅 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 检索 模型 训练 方法 装置 设备 菜谱 检索系统 | ||
1.一种跨媒体检索模型训练方法,其特征在于,包括:
对训练样本集的每组训练样本,分别获取当前组训练样本中的图像样本的目标特征、图像特征和文本样本的语义特征、文本特征,并基于所述文本样本确定所述目标特征与所述语义特征之间的关联关系;所述语义特征中包括所述目标特征;所述目标特征为图像样本中包含有相对应文本样本中指定信息的图像块的识别信息;所述语义特征为通过直接提取文本样本所得到的特征;所述文本特征为融合所述目标特征和所述语义特征得到的特征;
将每组训练样本的图像特征输入图文检索模型中的图像编码网络、文本特征输入至所述图文检索模型中的文本编码网络中,训练所述图文检索模型;
其中,所述文本样本仅包括一类文本数据;所述文本编码网络为异质图结构,其异构节点包括目标特征和语义特征,其连接边由目标特征与语义特征之间的关联关系确定;
其中,所述基于所述文本样本确定所述目标特征与所述语义特征之间的关联关系,包括:
对所述目标特征的每个文本词组或文本单词,依次遍历所述文本样本的每个文本语句;
若当前文本语句所包含的目标词组与当前文本词组相同,则所述当前文本语句对应的节点与所述当前文本词组对应的节点具有连接关系;
若所述当前文本语句所包含的目标单词与当前文本单词相同,则所述当前文本语句对应的节点与所述当前文本单词对应的节点具有连接关系。
2.根据权利要求1所述的跨媒体检索模型训练方法,其特征在于,所述获取当前组训练样本中的图像样本的目标特征、图像特征和文本样本的语义特征、文本特征,包括:
预先利用在图像中标注相应目标特征的目标训练样本集,训练得到目标识别网络;
将所述当前组训练样本中的图像样本输入至所述目标识别网络中,得到所述图像样本所包含的各目标特征。
3.根据权利要求2所述的跨媒体检索模型训练方法,其特征在于,所述利用在图像中标注相应目标特征的目标训练样本集之后,所述训练得到目标识别网络之前,还包括:
预先构建目标识别网络结构,所述目标识别网络结构包括输入层、卷积结构、池化层及分类器;
所述卷积结构包括基础运算组件和残差运算组件;所述基础运算组件用于对输入信息依次进行卷积处理、正则化处理、激活函数处理及最大池化处理;所述残差运算组件包括多个相连的残差块,每个残差块均包括多层卷积层,用于对所述基础运算组件的输出特征进行卷积计算;
所述池化层,用于将所述卷积结构的输出特征转化为目标特征向量,并输送至所述分类器;
所述分类器,用于通过对所述目标特征向量进行计算,并输出所属类别的概率。
4.根据权利要求1所述的跨媒体检索模型训练方法,其特征在于,所述获取当前组训练样本中的图像样本的目标特征、图像特征和文本样本的语义特征、文本特征,包括:
预先训练图像编码网络;所述图像编码网络包括特征提取网络和特征融合网络;
将所述当前组训练样本的图像样本输入至所述图像编码网络中;所述图像编码网络利用所述特征提取网络提取所述图像样本中每一张步骤图像的子图像特征,并将各子图像特征输入至所述特征融合网络进行特征编码,以得到所述图像样本的图像特征。
5.根据权利要求4所述的跨媒体检索模型训练方法,其特征在于,所述特征融合网络为长短期记忆神经网络,所述将各子图像特征输入至所述特征融合网络进行特征编码,包括:
调用图像特征编码关系式,对各子图像特征进行处理;所述图像特征编码关系式为:
;
式中,为所述长短期记忆神经网络的第个LSTM单元的输出,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211432939.6/1.html,转载请声明来源钻瓜专利网。